Софтуер

6 съвета как да избегнете бедствие в анализа на данни

CIO Media

Боб Виолино, CIO, САЩ
Технологията обещава сериозно увеличаване на бизнеса, но успехът не е гарантиран

Анализът на данни може да бъде изключително ценен за компаниите, тъй като дава дълбок поглед в информацията, която иначе може да не излезе на повърхността. Поради това той продължава да изяжда значителна част от ИТ бюджетите. 37% от ИТ лидерите казват, че анализът ще бъде цел на повечето ИТ инвестиции в техните компании през тази година. Това е най-високата единична категория според проучването "Състояние на CIO за 2020 г.".Но не съществуват гаранции, че инвестициите в аналитични инструменти ще се изплатят. Фактически дисциплината може да бъде изпълнена с проблеми, които е възможно да дерайлират проекти или да ги обрекат на провал.

Избягването на негативни резултати е във възможностите на всяка компания, която иска да използва аналитични инструменти. Просто изисква да се извърши необходимата подготовка и работа. Ето някои стъпки, които организациите могат да предприемат, за да избегнат бедствия в анализа на данни и разочарования.
Наличие на цялостна стратегия за управление на данниЕдна от първите стъпки, които компанията трябва да предприеме, е да изгради обща стратегия за управление на данни, която дефинира събирането, обработката и анализа им, казва Сет Робинсън, старши директор за технологичен анализ в професионалната ИТ организация CompTIA. "Компании вече предприеха подобни стъпки по отношение на киберсигурността като важен за бизнеса компонент на ИТ и управлението на данни трябва скоро да последва същия път, тъй като данните станаха толкова важни за бизнес дейностите", казва Робинсън.

CompTIA наскоро публикува отчет, озаглавен "Тенденции в управлението на данни". Той е основан на онлайн проучване на 400 ИТ специалисти в САЩ, проведено през декември 2019 г., и показва, че много компании са на ранен етап на изграждане на техните стратегии за управление на данни. Само 25% от участвалите в проучването организации усещат, че са точно там, където искат да бъдат, по отношение на управлението на корпоративните си данни. Въпреки че цифровите данни отдавна са част от ИТ дейностите, казва докладът, няма достатъчен фокус по отношение на работните роли или дефинираните компоненти.

Голям компонент на стратегията е притежаването на правилните умения за анализиране на данните, за да се отговори на нуждите на компанията. "Празнините в уменията, свързани с данни, са третото най-голямо предизвикателство, което компаниите цитират при създаването на планове за управлението на данни, а има и редица различни умения за данни, които са необходими", казва Робинсън. Към тях спадат администрация на бази данни, анализ на данни и визуализация на данни. "Някои от тези умения биха могли да бъдат трудни за научаване от съществуващия персонал, докато други умения може да изискват наемане на нови служители или партньорство", казва той.

Само 44% от компаниите казват, че имат вътрешни ИТ служители, които се занимават единствено с управлението и анализа на данни, според CompTIA. Макар че има фокус върху нови длъжности като учен за данни, съществува възможност и за повече традиционни роли, включително администратори на бази данни.."Трябва да се консултирате със и/или да обучите служителите на вашите компании, за да бъдат образовани за работа с данни, или никой от вашия екип няма да знае как да започне разговор за анализа, допълва Джереми Уортц, старши архитект в технологичната практика на консултантската фирма. Не е необходимо всеки да бъде учен за данни, но всички ръководители на компании трябва да имат основно разбиране за начина, по който аналитичните методи могат да донесат стойност."

Превърнете интегрирането на данни в приоритетЕдин от най-често срещаните проблеми, свързани с анализа на данни, е липсата на интеграция, казва Робинсън. "Без всички корпоративни данни да са свързани заедно, анализът ще бъде ограничен до намиране на връзки и прозрения", казва той.
Проучването на CompTIA установява, че интегрирането на данни е второто предизвикателство, което компаниите посочват в своите стратегии за управление на данните. Само ускоряването на анализа на данни е поставено пред него в класацията на предизвикателствата.

От няколко години проучване на CompTIA е установило, че когато бизнес звената работят независимо по технологични инициативи, това води до трудност за интеграцията. В резултат на това организациите се опитват да избегнат сенчестите ИТ в полза на съвместни подходи, които все пак дават известна свобода на бизнес звената и в същото време поддържат общ изглед на всички бизнес системи.
Събирането на данни в едно хранилище е част от този подход, се казва в доклада на CompTIA, и това е много важно за инициативи, свързани с изкуствен интелект, които включват възможно най-широките групи данни. Проучването отбелязва, че силозите за данни не се смятат за проблем от много от участниците в него, въпреки че интегрирането на данни е топ предизвикателство.
Имайки предвид, че 82% от компаниите казват, че имат висока или умерена степен на силози за данни, "има ясно разминаване за това колко проблематични са силозите за данни и как точно те трябва да бъдат интегрирани в обща група данни", се казва в доклада. В допълнение към техническото интегриране на източници на данни предприятията трябва да установят процеси на споделяне на данни между различните бизнес звена и ИТ функцията.

"Както при много други части на ИТ, има растяща нужда от сътрудничество между тези групи, казва Робинсън. Бизнес звената носят знанието за това кои прозрения ще бъдат най-полезни, а ИТ екипът има експертизата да предостави техническото решение. Редовна комуникация ще изгради подходящите вериги на обратна връзка за по-точен анализ на данните, който да служи най-добре на бизнеса."
Практикувайте ефективни DataOpsDataOps (операции с данни) е автоматизирана, ориентирана към процеса методология, която може да се използва от екипи за анализ на данни като набор от най-добри практики и е съзряла до степен да се превърне в нов и независим подход към анализа на данни. Методът се прилага към целия жизнен цикъл на данните от подготовката им до тяхното отчитане и потвърждава взаимосвързаното естество на екипа за анализ на данни и ИТ операциите.
Подобно на DevOps, DataOps включва динамичната методология за съкращаване на времетраенето на цикъла на разработването на аналитичните методи, съобразено с бизнес целите. И докато DevOps се фокусира върху постоянното предоставяне на качествен софтуер чрез използване на ИТ ресурсите и автоматизиране на тестването и внедряването, то DataOps се стреми да внесе някои подобрения в анализа на данни.
"За компаниите е важно да внедрят DataOps в пълния им обем, ако искат да подобрят резултатите от анализа", казва Джеймс Ройстър, старши директор по стратегия и операции с данни в мултинационалната биофармацевтична компания Amgen.
Компанията внедри платформа за DataOps от DataKitchen и имаше "голям успех", казва Ройстър. "DataOps включва проектиране на аналитични методи с вградено справяне с грешки, казва той. Анализът на данни се нуждае от автоматизирани начини за тест и контрол на качеството на данните, за да намали грешките и да избегне проблеми с интегритета на данните."
Организациите често се сблъскват с проблеми с грешни данни, които могат да провалят проекти, казва Ройстър. Те включват грешки в групата данни, с която работят. "Суровите данни трябва да бъдат изчистени и предварително обработени, казва той. Грешките са често срещани във всички големи групи данни."
Освен това излизането на едни и същи данни от различни местоположения с различни бизнес роли също може да създаде грешки. "Различните организации в едно и също предприятие могат да работят с едни и същи данни, използвайки различни алгоритми, работни потоци или допускания", казва Ройстър.
Мнозина не могат бързо да свържат и преобразуват данни, за да отговорят на непосредствени нужди. "Пазарът се развива бързо и бизнес изискванията се променят, казва Ройстър. Екипът за данни трябва да може да актуализира трансформациите на данни, за да е в крак с исканията на потребителите и заинтересованите страни."

Задавайте правилните въпроси за анализаОрганизациите трябва да остават фокусирани върху ключовите въпроси, които могат да донесат стойност чрез анализа на данни, казва Уортц от West Monroe. "Истината е, че независимо колко модерни са вашите инструменти и технологии, данните няма да донесат стойност, докато вие не извлечете прозрения, които водят до стратегически резултати", казва Уортц. "Всички аналитични методи, включително изкуствен интелект и машинно обучение, трябва да генерират прозрения", допълва той.
Ключът за постигането на това е да се задават въздействащи въпроси, които лесно се свързват със създаване на стойност, казва Уортц. "Колко време е необходимо перспективните клиенти да станат реални клиенти? Защо клиентите се оттеглят? Кога се оттеглят, казва той. След като имате основните отговори, вие може да съставите хипотези, свързани с бизнеса, и да започнете процеса отново с нови и по-конкретни въпроси."
West Monroe наскоро работи с клиент върху фокусиран върху продажби изкуствен интелект и инициатива за машинно обучение. "Моделът за машинно обучение генерира значително количество приходи за организацията, но ние следяхме прозренията от групата данни чрез подготовката за алгоритъма, казва Уортц. Много от нас са съгласни, че работата за машинно обучение генерира точно толкова стойност чрез намиране на общоприложими прозрения в данните като специфичен клиентски проблем в определен регион на базата на конкретен продукт, колкото чрез подаване на данни в алгоритъм за изкуствен интелект."
Това даде на организацията възможност за бързо добавяне на стойност, тъй като West Monroe изгради дългосрочната стойност на системата за машинно обучение, "всичко това чрез подаване на по-висококачествена група данни към алгоритъма", казва Уортц.

Анализирайте само чисти, точни данниТази практика би могла да попадне в категорията на изграждане и изпълнение на обща стратегия за управление на данните. Но заслужава да бъде отбелязана като най-добра практика сама по себе си. Ако данните, които се анализират, не са точни, резултатите и прозренията ще бъдат опетнени.
"Най важната стъпка според мен е, че данните трябва да могат да бъдат защитени, разбрани и приети, преди да се правят каквито и да било прозрения, казва Кати Руди, главен директор за данни и анализи във фирмата за технологични проучвания и консултации ISG. Това означава, че данните са чисти, актуални, проверени и от достоверни системи със записи. Чисти данни означава, че трябва да отделите време да ги прегледате и изчистите преди какъвто и да било анализ. Често това отнема доста време, особено ако работите с различни бази данни, за да предоставите отчети", допълва Руди.
Но това е критична стъпка и често се смята за майсторско управление на данни. "Управлението трябва да заложи на източниците, валидността и точността на данните. В противен случай няма да получи резултатите и вие ще изразходвате повече време да защитавате числата, отколкото да носите стойност, казва Руди. Освен това ще създаде ненужни цикли за екипа за данни и потенциално ще ви накара да загубите правдоподобност."
Притежаването на солидна техническа основа е важно, "особено когато е свързано с готовност на данните", казва Пратиуш Рей, CIO на доставчика на онлайн услуги за студенти Kaplan Higher Education. "В много организации не се обръща достатъчно внимание на съществуващата архитектура. Това води до дублиране на записи и нечисти данни, което често затруднява анализа."
Създайте сплотен екип за съвместен анализУспешният анализ и избягването на разочарования изисква екипна работа, а това често означава премахване на изолацията на отделите. "Организациите се затрудняват да създадат и споделят практики за работа с данни, защото те се съхраняват в множество силози и липсват инструменти за управление, откриване на данни, каталогизиране и сътрудничество между инженерни, аналитични и бизнес екипи", казва Максим Шипка, CTO на Vortexa - компания, която предоставя аналитични услуги за енергийния отрасъл.
"Структурирайте екипите си като мултифункционални с баланс между бизнес анализатори, инженери на данни, учени за данни, софтуерни инженери и оценители на качеството, казва Шипка. Избягвайте клопките на това да имате отделен "екип с учени за данни". Това е сигурна рецепта за провален проект."

Vortexa уверява, че аналитичните екипи са напълно готови с избора на аналитични инструменти, които използва, като платформата за операции с данни от Lenses.io и облачните услуги от Amazon Web Services. Но независимо от аналитичните инструменти, които използват, организациите трябва да очакват да имат комбинация от учени за данни и инженери на данни в екипа за анализ на данни, казва Шипка. "Точното съотношение ще зависи от сложността на въпросите от страна на бизнеса, които се нуждаят от отговор, и сложността на необходимите технологии за постигането на тази цел", казва тя.
Превод и редакция Мариана Апостолова


X