Treść nieustrukturyzowana:niewykorzystane źródło paliwa dla sztucznej inteligencji i uczenia maszynowego

Autor:Alex Welsh , wiceprezes ds. praktyki analitycznej, Ephesoft

Czy wybrałbyś miejsce wyjazdu na wakacje, gdybyś miał dostęp tylko do 10 do 20 procent recenzji i informacji w witrynie internetowej poświęconej podróżom? Jeśli to zrobisz, prawdopodobnie będziesz miał niezapomnianą podróż, ale z powodów, które możesz nie lubić. Jednak organizacje rządowe i przedsiębiorstwa — od produkcji po firmy ubezpieczeniowe i od opieki zdrowotnej po bankowość — podejmują decyzje w tym samym kierunku. I robią to od lat. Patrzą na łatwe informacje, które mogą uzyskać z danych strukturalnych, ignorując dane nieustrukturyzowane, które według Deloitte mogą stanowić 80 do 90 procent treści generowanych na całym świecie, co sprawia, że nieustrukturyzowane dane są ogromnym źródłem niewykorzystanej wartości.

Na szczęście postęp w sztucznej inteligencji (sztucznej inteligencji) i uczeniu maszynowym sprawia, że teraz możliwe i niedrogie jest przesiewanie i znajdowanie znaczenia w ogromnych ilościach nieustrukturyzowanych danych uzyskanych z plików wideo i audio, e-maili, dzienników, postów w mediach społecznościowych, a nawet powiadomień. z urządzeń Internetu rzeczy (IoT). Wszystkie te dane mogą przynieść ogromne korzyści, na przykład gdy są wykorzystywane do automatyzacji zadań, które są ręcznie intensywne i często bardzo powtarzalne. Jednym z zadań, na przykład, jest zwracanie uwagi na sygnały ostrzegawcze:określone kryteria lub zachowania, które mogą wskazywać, że coś jest nie tak i należy szybko podjąć działania naprawcze. Przyjrzyjmy się kilku przypadkom z różnych branż.

Co powiesz na roszczenie ubezpieczeniowe, które na pierwszy rzut oka wydaje się dobre, ale zasługuje na zbadanie, lub kandydata do pracy, który może ukrywać informacje? A co z wysyłką łatwo psujących się produktów farmaceutycznych, które mogły nie być schłodzone przez część podróży, lub umową, która może naruszać prawo danego kraju lub łamie istniejącą umowę z inną firmą? Ważną rzeczą jest to, że czerwona flaga wskazuje problemy, które, jeśli nie zostaną zaznaczone, mogą spowodować poważne szkody.

Sztuczna inteligencja jest bardzo głodna danych

W jaki sposób sztuczna inteligencja i uczenie maszynowe umożliwiają wydajniejszą i skuteczniejszą analizę danych? Poprzez karmienie go danymi. Dając modelowi uczenia maszynowego przykłady dobrych i złych transakcji, uczy się rozróżniania tych dwóch typów. A im więcej danych przetwarza model uczenia maszynowego, tym bardziej wzmacnia te lekcje, zwiększając dokładność.

Tak więc, chociaż sztuczna inteligencja i uczenie maszynowe robią wielkie postępy, firmy i inne organizacje muszą nadrobić zaległości. Pomyśl o tym w ten sposób:dane są jak paliwo. Potrzebujemy go, aby napędzać nasze myślenie i podejmować mądre decyzje. Ale wydobyliśmy wszystkie proste rzeczy, uporządkowane dane, które docierają w ładnych i schludnych pakietach. Ale tutaj analogia do paliwa się załamuje:chociaż kolejny galon gazu pozwala nam przejechać kolejne od 20 do 30 nieparzystych mil, im więcej danych włożymy, pozwala nam podejmować znacznie lepsze i dokładniejsze decyzje – a nie tylko kolejne 20 do 30 - warta nieparzysta mila — i jeszcze szybsza.

Jednak przez tak długi czas ogromna część naszych danych, nasze nieustrukturyzowane dane, pozostawały niewykorzystane, ponieważ były zbyt drogie i zbyt trudne do uzyskania i przetworzenia. I chociaż tak już nie jest, ponieważ nowa technologia gromadzenia i analizowania nieustrukturyzowanych danych staje się dostępna, wiele osób w biznesie i innych organizacjach przeoczyło te postępy.

Gdzie są inteligentne pieniądze

International Data Corporation (IDC) przewiduje, że do 2020 r. organizacje, które analizują zarówno dane ustrukturyzowane, jak i nieustrukturyzowane — czyli wszystkie istotne dane — i dostarczają przydatne informacje, osiągną dodatkowy wzrost wydajności o 430 miliardów USD w porównaniu z konkurencją, która nie przeprowadza takiej analizy danych. A firmy, które to rozumieją, nie czekają do 2020 roku. Dyrektor międzynarodowej firmy ubezpieczeniowej z siedzibą w Niemczech uważa nieustrukturyzowane dane za największe ryzyko. Rozumieją liczby i pracują, aby nie dać się zaskoczyć, pisząc polisy ubezpieczeniowe, które narażają ich na zobowiązania, których mogli uniknąć.

Połączona moc big data, sztucznej inteligencji i uczenia maszynowego może ułatwić przetwarzanie informacji związanych z jeszcze bardziej złożonymi wyzwaniami. Na przykład banki i inne organizacje mogą dokładniej i szybciej wykrywać oszustwa, uchylanie się od płacenia podatków, pranie brudnych pieniędzy i inne schematy poprzez przeszukiwanie wcześniej nieprzetworzonych, nieustrukturyzowanych danych. Pozwala im to wyłapywać i zamykać przypadki oszustw i nadużyć, a także unikać wielu fałszywych alarmów, które mogą wystąpić, gdy polegają tylko na ustrukturyzowanych danych. Umowy finansowania handlu, w tym umowy i wiele źródeł danych, między krajami lub firmami można również przejrzeć w celu ustalenia, czy istnieje oszustwo lub niesprawiedliwość, niezależnie od tego, czy są one zamierzone, czy nie.

Ponadto sztuczna inteligencja i uczenie maszynowe mogą pomóc bankom i innym rodzajom firm lepiej identyfikować i weryfikować tożsamość swoich klientów za pomocą zautomatyzowanych procedur Poznaj swojego klienta (KYC). Takie procedury mogą zapobiegać ich celowemu lub nieumyślnemu wykorzystywaniu do prania pieniędzy, a także zapobiegać występowaniu przekupstwa i innych form korupcji. Procedury KYC mogą również umożliwić firmom lepsze zrozumienie transakcji finansowych i potrzeb swoich klientów, a także pomóc im bardziej rozważnie zarządzać ryzykiem. Inne zalety obejmują skrócenie czasu uzyskania przychodów podczas wdrażania nowych klientów, dzięki czemu KYC nie jest kolejnym kosztem do poniesienia, ale zamiast tego źródłem zysku.

AI i uczenie maszynowe mogą zwiększyć Twoją konkurencyjność

Ze wszystkimi korzyściami uzyskanymi dzięki sztucznej inteligencji i uczeniu maszynowemu — oraz postępom w technologii wykorzystywanej do przetwarzania danych ustrukturyzowanych i nieustrukturyzowanych — nadszedł czas, aby więcej firm i organizacji skorzystało z największego dostępnego źródła informacji:własnych nieustrukturyzowanych danych.

O autorze

Alex Walijski kieruje globalną praktyką analityczną Ephesoft. Jest doświadczonym dyrektorem sprzedaży, kierownikiem projektu i przedsiębiorcą z pasją do rozwiązywania krytycznych problemów klientów za pomocą innowacyjnych, opłacalnych rozwiązań technologicznych.