A gépi tanulás automatizálása folyamatos integrációval
Idén márciusban a COVID-19 ellenére, második alkalommal került megrendezésre a REINFORCE AI CONFERENCE Budapesten. A háromnapos online konferencia remek lehetőséget adott megismerkedni a mesterséges intelligencia (MI) világ vezető szakértőivel, és platformot teremtett a diskurzushoz, az innovációhoz és a kapcsolatépítéshez. Én kaptam a megtiszteltetést, hogy részt vegyek rajta a Netlife Robotics képviseletében.
Az előadások különböző témákban zajlottak: többek között a MI integrálása a termelésbe, chatbotok, önvezető autók, az etika és az MI jövője kerültek bemutatásra és megvitatásra. Bővebb és további információ elérhető a konferencia hivatalos honlapján: https://reinforceconf.com/.
Számomra az esemény egyik legpraktikusabb előadása a folyamatos gépi tanulásról szólt. Ez a téma nem csak, hogy kifejezetten érdekel, de cégünknek is hasznos. Ezért döntöttem amellett, hogy jelen blogban megosztom veletek a részleteket.
A gépi tanulás workflow nehézségei
Korunk új villamos energiája, a gépi tanulás (Machine Learning), kezd külön tudománnyá érlelődni, és minden iparágban népszerűvé válni. Gondolhatunk itt az orvostudományra, közlekedésre, de akár az online marketingre is.
Nehézség azonban, hogy a tanulási modellek avagy a dedukciók fejlesztésének folyamata összetettebb a hagyományosabb szoftverekhez képest. Soha nem jelentett akkora kihívást a komplexebb projektek kezelése mint manapság.
A legtöbb szoftverrel ellentétben a tanulási modellek fejlesztése zavarosabb, mivel a teljesítményt nem jóban vagy rosszban mérik, hanem különféle mennyiségi mérésekkel és a modell összetettségével.
Ezenkívül a valós adatok folyamatosan változnak, befolyásolva a gépi tanulás teljesítményét a termelésben. Ez azt jelenti, hogy az alkalmazást folyamatosan figyelemmel kell kísérni, és a modellt új adatok alapján át kell képezni.
Erre a problémára talált megoldást Elle O’Brian, aki szintén előadott a Reinfroce AI konferencián.
A gépi tanulás automatizálása
A paraméter finomhangolás komplexitásának és az adatkészletek dinamikus változtatásának kezelésre, Elle O’Brien adattudós és a Michigani Egyetem Információs Iskolájának előadója egy roppant egyszerű ámde praktikus megoldással állt elő: automatizáljuk a gépi tanulást folyamatos integrációval!
A folyamatos integráció egy szoftverfejlesztési gyakorlat, ahol a fejlesztők rendszeresen egyesítik kódváltásaikat egy központi adattárban, amely után automatizált tesztek futnak.
A folyamatos integráció kulcsfontosságú célja a hibák gyorsabb felkutatása és elhárítása, a szoftverminőség javítása és az új szoftverfrissítések érvényesítéséhez és kiadásához szükséges idő csökkentése.
A fiatal tudós hölgy által kidolgozott nyílt forráskódú framework a kovetkező linken érhető el: https://cml.dev/. De rengeteg audiovizuális oktató anyag található a YouTube csatornáján is.
Framework elérhetősége
A CML (Continuous Machine Learning) framework segítségével könnyen és összetett beállítások nélkül elkészíthető egy saját ML platform.
Lehet hozzájuk használni GitHub, GitLab vagy akár más népszerű felhőszolgáltatást is (AWS, Azure, GCP).
A GitLab vagy a GitHub segítségével lehet kezelni a tanulási modelleket ezenfelül nyomon is lehet követni, hogy ki és mikor módosította a modelleket vagy az adatokat.
A CML automatikusan futtatja a teszteket és rendereli a diagramokat (pl. TensorBoard) minden egyes Git Pull kérelem után.
Konklúzió
A gépi tanulási technikák dinamikusan fejlődnek és egyre bonyolultabb feladatokat látnak el.
Változnak az ismereteink is arról, hogy hogyan kezelhetjük és hogyan juttathatjuk el az ilyen alkalmazásokat a termeléshez.
A folyamatos integrálás alapelveinek és gyakorlatainak kiterjesztésével és kibővítésével biztonságosabb és megbízhatóbb módon kezelhetjük a gépi tanulási alkalmazások változásainak publikákásával járó kockázatokat.
Nagyon kíváncsi vagyok, hogy ezzel módszerrrel milyen új eredményeket érhetünk el a közeljövőben.
Vajon mennyire gyorsítja fel a gépi tanulás fejlődését?
Cikkünk szerzője Balogh Marcell, aki egyben cégünk kutatója:
Forrás: Elle O’Brian adattudós előadása a Reinforce AI konferencián