Duże modele językowe - jak skutecznie z nich korzystać? - MAGAZYNIT.PL - ERP, Systemy ERP, CRM, Business Intelligence

Szczegóły: Kategoria: WIADOMOŚCI; Utworzono: 08 lipiec 2024

Sztuczna inteligencja nie jest niczym nowym, ale w przestrzeni medialnej głośno zrobiło się o niej wraz z pojawieniem się szeroko dostępnego dużego modelu językowego jakim jest GPT. Możliwości tego, jak i podobnych modeli wywołały ogromne zainteresowanie – także po stronie biznesu, który szuka odpowiedzi jak można wykorzystać LLM (ang. Large Language Models – duże modele językowe) w swoich działaniach.

	REKLAMA

Niedawny wzrost zainteresowania generatywną sztuczną inteligencją wynika przede wszystkim z gwałtownego i szerokiego zastosowania dużych modeli językowych, takich jak GPT-4. Modele te stały się przedmiotem gorących dyskusji wśród ekspertów; niektórzy postrzegają je jako kolejny etap ewolucji sztucznej inteligencji (AI), podczas gdy inni koncentrują się na ich wadach i ograniczeniach. Już teraz rynek wycenia takie rozwiązania na 6 mld dolarów z perspektywą wzrostu do 30 mld dolarów w 2030 roku.

Duże modele językowe doskonale nadają się do polepszania jakości interakcji człowiek-system za pomocą języka naturalnego, automatyzacji prostych procesów, przetwarzania informacji tekstowych i generowania kreatywnych treści. Możliwości te sprawiają, że firmy decydują się na inwestycje w takie rozwiązania. – komentuje Bogusław Kosęda, Data Science Consultant, Endava Poland

Kluczowym aspektem wdrażania LLM jest odpowiednia ewaluacja potrzeb i możliwości. Ilu pracowników będzie korzystać z rozwiązań wykorzystujących LLM, jakie mają być ich zadania, czy LLM ma mieć dostęp do firmowych danych, czy będzie istniał zespół odpowiedzialny za zarządzanie i weryfikację generowanych odpowiedzi? Wykorzystanie dużych modeli językowych budzi wiele pytań i wątpliwości.

Dobór modelu do potrzeb firmy

Wszystko zaczyna się od wytypowania zadań, do których chcemy wykorzystać LLM i doboru odpowiedniego modelu, który może im sprostać. Proste czynności, takie jak generowanie krótkich tekstów, mogą być rozwiązywane za pomocą stosunkowo małych modeli, które można uruchomić nawet na podstawowych urządzeniach takich jak laptop. Bardziej złożone modele wymagają znacznej mocy obliczeniowej do szkolenia się, ale także do samego procesu generowania wyników. Obecnie najłatwiejszym sposobem dla firm na korzystanie z najbardziej zaawansowanych modeli LLM jest użycie tych wstępnie wytrenowanych i wdrożonych w chmurze. Przykładem może być model Gemini dostarczany przez Google. Co więcej, można wykorzystać rozwiązania, które integrują LLM z systemami firmy, a także koordynują i monitorują ich pracę. Jednymi z najpopularniejszych przykładów takich bibliotek są LangChain i LangSmith.

Połączenie modelu LLM z danymi firmy daje mu możliwość wyszukiwania i wnioskowania na temat danych specyficznych dla przedsiębiorstwa. Teoretycznie oznacza to, że taki model LLM staje się maszyną do rozwiązywania problemów biznesowych, których rozwiązanie znajduje się już w danych. Dodatkowo, praca modelu LLM na firmowych danych znacznie ogranicza halucynacje, choć nie eliminuje ich całkowicie. Na szczęście narzędzia do łączenia LLM z zewnętrznymi bazami danych posiadają mechanizm śledzenia pochodzenia informacji wykorzystywanych przez LLM do generowania wyników - wyjaśnia Bogusław Kosęda, Data Science Consultant, Endava Poland.

Chociaż każdy z nas może wchodzić w interakcje z modelami LLM za pomocą promptów, poważne aplikacje biznesowe wymagają odpowiednich umiejętności inżynierskich. W tym przypadku umiejętności inżynierii ML (ang. Machine Learning) (w zakresie badań i rozwoju), QA (ang. Quality Assurance) w zakresie testowania oraz umiejętności LLMOps (ang. Large Language Model Operations) w zakresie wdrażania, monitorowania i konserwacji.

Ograniczenia i problemy dużych modeli językowych (LLM)

Duże modele językowe obarczone są też szeregiem ograniczeń, dlatego tak ważny jest odpowiedni nadzór i ewaluacja uzyskanych w pracy z nimi wyników.

Halucynacje - modele mogą generować wyniki, które są błędne, bezsensowne lub nieistotne dla danej wejściowej informacji. Wynika to często z niepokrywających się danych wykorzystanych w procesie uczenia. LLM może udzielać np. porad prawnych z innego systemu prawnego niż z tego od którego pada zapytanie. Problem ten nadal pozostaje nierozwiązany i jest jednym z głównych ograniczeń tej technologii.

Trudność testowania LLM - ze względu na "kreatywność" LLM, przetestowanie wszystkich możliwych danych wejściowych i wyjściowych, które mogą pojawić się w produkcji jest niemożliwe. Dlatego tak ważny jest monitoring metryk i nadzór nad systemami opartymi na LLM.

Etyka - modele LLM mogą generować wyniki obarczone uprzedzeniami. Uprzedzenia te pochodzą z zestawów danych, które zostały przekazane modelowi podczas etapów wstępnego uczenia lub dostrajania.

Koszt - w przypadku największych LLM płacimy za transfer danych do i z modelu. W niektórych przypadkach biznesowych koszty te mogą być znaczne.

Utrzymanie - jeśli dostawca LLM zaktualizuje konkretny model, który był wykorzystywany w danym rozwiązaniu, należy ponownie przeprowadzić proces kontroli jakości i monitorowania - co również może być kosztowne.

Technologia zmienia się na naszych oczach a każdego dnia trafiają do nas informacje o nowych możliwościach czy zastosowaniu dużych modeli językowych, dlatego tak ważne jest odpowiednie przygotowanie i ocena naszych potrzeb względem LLM.

WIADOMOŚCI
19-09-24
Sztuczna inteligencja, planowanie produkcji, zarządzanie finansami firmy – to tylko niektóre z tematów, które omówią eksperci Comarch Enterprise Solutions podczas kolejnych Spotkań z Użytkownikami Comarch ERP XL. To branżowe wydarzenie od lat gromadzi klientów flagowego systemu krakowskiej spółki, stawia na networking i wymianę biznesowych doświadczeń oraz adresuje ważne pytania o przyszłość i kondycję rynku ERP w Polsce. Co w tym roku znajdzie się na liście tematów?
Czytaj więcej...

WIADOMOŚCI
18-09-24
Forterro, czołowy europejski dostawca oprogramowania dla średnich przedsiębiorstw z sektora przemysłowego, ogłosił premierę Orderwise Cloud – zaawansowanej platformy ERP, stworzonej dla firm z branży handlu detalicznego, hurtowego, magazynowania oraz e-commerce.
Czytaj więcej...

WIADOMOŚCI
16-09-24
Abas Business Solutions Poland, dostawca oprogramowania Abas ERP dla firm produkcyjnych, z dumą ogłasza swoją obecność na XXV Międzynarodowych Targach Technologii dla Odlewnictwa METAL w Kielcach, które odbędą się w dniach 24-25 września 2024 roku. Podczas wydarzenia, które jest jednym z najważniejszych spotkań branży metalurgicznej w Polsce, specjaliści z Abas zaprezentują kluczowe rozwiązania technologiczne, które pomagają w zrównoważonym rozwoju przemysłu odlewniczego.
Czytaj więcej...

WIADOMOŚCI
12-09-24
Przepisy regulujące korzystanie ze sztucznej inteligencji przez firmy (tzw. AI Act) weszły w życie 1 sierpnia 2024 r. Ich celem jest wspieranie biznesu w odpowiedzialnym wdrażaniu oraz rozwoju AI, uwzględniając podnoszenie poziomu bezpieczeństwa obywateli Unii Europejskiej. Oznacza to, że przedsiębiorcy wszystkich branż będą mieli nowe obowiązki w zachowaniu transparentności w obszarze AI. Zmiany prawne obejmują wszystkie systemy i aplikacje, które wykorzystują technologię sztucznej inteligencji.
Czytaj więcej...

WIADOMOŚCI
12-09-24
Przedsiębiorstwa na całym świecie są świadome korzyści oferowanych przez generatywną sztuczną inteligencję – już teraz z AI korzysta ok. 65 proc. z nich . Otrzymywane przez firmy rezultaty mogą jednak znacznie się od siebie różnić. Jak zauważają eksperci firmy Progress, kluczem do skutecznego i efektywnego wdrożenia sztucznej inteligencji w obrębie przedsiębiorstwa jest zrozumienie jej zmiennej, dynamicznej natury.
Czytaj więcej...

Feerum SA z systemem...

Impuls EVO w Selfa G...

Feerum SA z systemem...

Impuls EVO w Selfa G...

Feerum SA z systemem...

Impuls EVO w Selfa G...

Konferencje „Dzień Dobrych Praktyk – kadry, płace, HR”

Konferencja DPS Forum 2024

Dynamics 365. Kierunek: AI. Wykorzystaj potencjał AI w swoim biznesie

Dynamics 365. Kierun...

Wdrożenie ERP enova3...