A gépi tanulás automatizálása folyamatos integrációval

Social share

Idén márciusban a COVID-19 ellenére, második alkalommal került megrendezésre a REINFORCE AI CONFERENCE Budapesten. A háromnapos online konferencia remek lehetőséget adott megismerkedni a mesterséges intelligencia (MI) világ vezető szakértőivel, és platformot teremtett a diskurzushoz, az innovációhoz és a kapcsolatépítéshez. Én kaptam a megtiszteltetést, hogy részt vegyek rajta a Netlife Robotics képviseletében.

Az előadások különböző témákban zajlottak: többek között a MI integrálása a termelésbe, chatbotok, önvezető autók, az etika és az MI jövője kerültek bemutatásra és megvitatásra. Bővebb és további információ elérhető a konferencia hivatalos honlapján: https://reinforceconf.com/.

Számomra az esemény egyik legpraktikusabb előadása a folyamatos gépi tanulásról szólt. Ez a téma nem csak, hogy kifejezetten érdekel, de cégünknek is hasznos. Ezért döntöttem amellett, hogy jelen blogban megosztom veletek a részleteket.

A gépi tanulás fogalma

A gépi tanulás workflow nehézségei

Korunk új villamos energiája, a gépi tanulás (Machine Learning), kezd külön tudománnyá érlelődni, és minden iparágban népszerűvé válni. Gondolhatunk itt az orvostudományra, közlekedésre, de akár az online marketingre is.

Nehézség azonban, hogy a tanulási modellek avagy a dedukciók fejlesztésének folyamata összetettebb a hagyományosabb szoftverekhez képest. Soha nem jelentett akkora kihívást a komplexebb projektek kezelése mint manapság.

A legtöbb szoftverrel ellentétben a tanulási modellek fejlesztése zavarosabb, mivel a teljesítményt nem jóban vagy rosszban mérik, hanem különféle mennyiségi mérésekkel és a modell összetettségével.

Ezenkívül a valós adatok folyamatosan változnak, befolyásolva a gépi tanulás teljesítményét a termelésben. Ez azt jelenti, hogy az alkalmazást folyamatosan figyelemmel kell kísérni, és a modellt új adatok alapján át kell képezni.

Erre a problémára talált megoldást Elle O’Brian, aki szintén előadott a Reinfroce AI konferencián.

A gépi tanulás automatizálása

A paraméter finomhangolás komplexitásának és az adatkészletek dinamikus változtatásának kezelésre, Elle O’Brien adattudós és a Michigani Egyetem Információs Iskolájának előadója egy roppant egyszerű ámde praktikus megoldással állt elő: automatizáljuk a gépi tanulást folyamatos integrációval!

A folyamatos integráció egy szoftverfejlesztési gyakorlat, ahol a fejlesztők rendszeresen egyesítik kódváltásaikat egy központi adattárban, amely után automatizált tesztek futnak.

A folyamatos integráció kulcsfontosságú célja a hibák gyorsabb felkutatása és elhárítása, a szoftverminőség javítása és az új szoftverfrissítések érvényesítéséhez és kiadásához szükséges idő csökkentése.

A fiatal tudós hölgy által kidolgozott nyílt forráskódú framework a kovetkező linken érhető el: https://cml.dev/. De rengeteg audiovizuális oktató anyag található a YouTube csatornáján is.

Framework elérhetősége

A CML (Continuous Machine Learning) framework segítségével könnyen és összetett beállítások nélkül elkészíthető egy saját ML platform.

Lehet hozzájuk használni GitHub, GitLab vagy akár más népszerű felhőszolgáltatást is (AWS, Azure, GCP).

A GitLab vagy a GitHub segítségével lehet kezelni a tanulási modelleket ezenfelül nyomon is lehet követni, hogy ki és mikor módosította a modelleket vagy az adatokat.

A CML automatikusan futtatja a teszteket és rendereli a diagramokat (pl. TensorBoard) minden egyes Git Pull kérelem után.

Konklúzió

A gépi tanulási technikák dinamikusan fejlődnek és egyre bonyolultabb feladatokat látnak el.

Változnak az ismereteink is arról, hogy hogyan kezelhetjük és hogyan juttathatjuk el az ilyen alkalmazásokat a termeléshez.

A folyamatos integrálás alapelveinek és gyakorlatainak kiterjesztésével és kibővítésével biztonságosabb és megbízhatóbb módon kezelhetjük a gépi tanulási alkalmazások változásainak publikákásával járó kockázatokat.

Nagyon kíváncsi vagyok, hogy ezzel módszerrrel milyen új eredményeket érhetünk el a közeljövőben.

Vajon mennyire gyorsítja fel a gépi tanulás fejlődését?

Cikkünk szerzője Balogh Marcell, aki egyben cégünk kutatója:

Forrás: Elle O’Brian adattudós előadása a Reinforce AI konferencián