Проекти

Lockheed Martin ускорява науката за данни с Domino Data Lab

CIO Media

Компанията предоставя на своите учени за данни възможности за самообслужване и централизирано моделиране

Клинт Баултън, CIO, САЩ

Корпоративните учени за данни са затруднени в сизифовското усилие да получат технологичните активи, които се изискват за изграждане на модели от данни. Но това едва ли е единственото препятствие: поради това, че тези процеси протичат бавно в силози, екипите от учени за данни често дублират усилия. Това е влудяваща комбинация от реквизиционен ад и повторения.

Тези затруднения не са чужди и на компанията за отбранителна техника Lockheed Martin, която инсталира софтуерна платформа, за да направи разработването на модели за машинно обучение (МО) и изкуствен интелект (ИИ) по-ефикасни. Платформата централизира активите, необходими за създаване на модели от данни, и намали разходите на компанията за проекти за МО и ИИ с 20 милиона щатски долара годишно, казва Мат Сиймън, главен директор по данни и анализи на корпоративните операции.

Способностите за самообслужване са критични за подхода на компанията към демократизация на достъпа до данни, казва Сиймън. "Ние намаляваме бариерите, за да започнем и изпълним нови проекти, които ще ни помогнат да вземаме по-добри и по-бързи решения с данни."

Възприемането на технологията за самообслужване расте бързо. То представлява следващата фаза от феномена на консумеризацията, който поставя мобилни компютри и приложения в ръцете на милиона хора повече, отколкото преди десетилетие. Но може би никъде другаде интересът не е по-голям, отколкото в науката за данни, в която възможностите на усъвършенстваните аналитични методи за откриване на бизнес прозрения са ограничавани от същите тромави процеси, отдавна задържащи компаниите да постигнат потенциала си.

Премахване на пречката с доставянето
Lockheed Martin неутрализира проблема с помощта на Domino Data Lab, чиято колаборативна платформа за наука за данни помага на над 300 учени за данни на компанията да изграждат модели по-ефикасно и да поставят основа за бъдещи учени за данни, които идват в компанията, казва Сиймън.

Преди да изберат Domino Data, учените за данни на Lockheed Martin са прекарали прекалено дълго време в идентифициране на компютърните ресурси, от които се нуждаят, и в заявяването им от ИТ. Тези служители чакат ИТ да изградят, инсталират и конфигурират интегрираната среда за разработване (IDE) и други инструменти за програмиране на сървър, в който те влизат всеки път когато се нуждаят от достъп до своите проекти и ресурси. Но много учени за данни работят по много проекти, които често изискват много системи, сървъри и интегрирани среди за разработване, създавайки постоянен цикъл на блокиране и промяна на инфраструктурата.

Учените за данни, които отделят време за набавяне на инфраструктура или включване в софтуерен инженеринг, прекарват по-малко време в изграждане на модели от данни. Освен това работата страда, тъй като Lockheed Martin не може да идентифицира трудните моменти на учените за данни, които се опитват да вършат работата си, отделно от това да следят състоянието на проектите, казва Сиймън.

"Ние нямахме достатъчна видимост за това кои бяха играчите, които се опитваха да движат иновациите, да не говорим за това кои трябваше да имат разрешение за това", казва Сиймън. "Става дума за изваждане на данни от силоза им и предаването им в ръцете на хората по по-ефикасен начин."

Пада "доминото" на моделирането на данни
Domino Data обединява тези способности в графичен потребителски интерфейс (GUI), основан на браузър, където потребителите имат достъп до ресурси за разработване чрез меню от шаблони за софтуер, библиотеки за машинно обучение и инфраструктура. Те могат да избират езици за програмиране (Python, R, SAS, etc.) и компютърни ресурси по заявка (централни процесори, графични процесори или Spark клъстери), за да изграждат моделите си. Служителите могат да избират да работят с частни или публични облачни системи, за да избегнат блокиране на ресурси.

За придържане към стратегията DevSecOps на компанията пакетите за програмиране и техните зависимости се разпределят автоматично, докато способности за следене и одитиране на код, данни и инструменти осигуряват средства за гарантиране на видимост и съвместимост. Тъй като учените за данни имат достъп до необходимите инструменти и инфраструктура, 90% от инженерите, които по-рано бяха назначени да поддържат тези работни потоци, сега поддържат други бизнес проекти, казва Сиймън.

Екипите от учени за данни изграждат нови модели за МО, за да симулират дизайна на нови продукти в областта на аеронавтиката. Други модели помагат да се постигне по-голяма видимост в капацитета на производствените линии в заводите, включително проследяване на потока от материали от сглобяване до производство и откриване на дефекти и проблеми на поддръжката. Отделни проекти се фокусират върху модели за задълбочено обучение, които намаляват риска за веригата на доставки.

Сиймън казва, че софтуерът намалява времето за започване на създаване на модели от данни и пускането им в производство от седмици на минути, като същевременно се постига десетократно увеличение на производителността поради по-големия достъп до ресурси. Ръководителите на екипи от учени за данни постигат по-голяма видимост в проекти, оптимизирано сътрудничество и споделяне на знание, докато ИТ екипите могат да управляват и ръководят използването на инфраструктурата и разходите. "Платформата въвежда ред в хаоса", казва Сиймън.

Ноу-хау в науката за данни все пак е необходимо
Лесното използване предполага, че Domino Data е решение за бързо разработване за анализи, които се използват от бизнес потребители, но случаят далеч не е такъв. Макар че много инструменти за моделиране на областта на науката за данни дават възможност на персонал с ограничена техническа способност да щраква върху компютърни активи и да ги мести с курсора, Domino Data изисква известни знания за програмиране - детайл, относно който компанията остава на твърди позиции.

"Организации, които извършват смислена работа с данни, ще трябва да разчитат на наука за данни с програмиране на код, за да вършат тази работа", казва Джошуа Подушка, главен учен за данни на Domino Data. Domino Data Lab не трябва да бъде първият избор на така наречените аматьори в науката за данни, които се опитват да научат занаята.

Затова потребителите на Domino Data на Lockheed Martin са инженери, които практикуват МО и ИИ, а Сиймън очаква възприемането на платформата да се увеличава.

Сиймън признава, че Domino Data не е за всеки, отбелязвайки, че е критично да се включи стратегия за данни, която поддържа всичко - от инструменти за моделиране на данни от ниско ниво до по-сложни алгоритми и дълбоки невронни мрежи. Дори така, казва той, "винаги ще има място за разширена иновация, която идва от решения на базата на код".

Наблюдатели на индустриалния пазар са склонни да се съгласят. Глобалните разходи за технологии за ИИ ще се увеличат от 50.1 милиарда щатски долара през 2020 г. до повече от 110 милиарда щатски долара през 2024 г., тъй като повече предприятия опитват да култивират бизнес прозрения мащабно според проучване на IDC.

Превод и редакция Мариана Апостолова

X