Chińska firma DeepSeek, operująca na mniejszej liczbie chipów, bazujących na starszej technologii, potrafi opracować modele sztucznej inteligencji porównywalne do tych tworzonych przez firmy Meta czy Open AI; do tego za zdecydowanie mniejsze fundusze – ocenił w rozmowie z PAP Jan Jęcz, analityk Polityki Insight.
„DeepSeek jest chińską firmą z branży sztucznej inteligencji, działającą na rynku już od kilku lat. Przedsiębiorstwo stworzyło już kilka modeli sztucznej inteligencji, które są dostępne dla wszystkich. Nie są to jednak modele open source, bo nie mamy choćby dostępu do informacji o tym, jakie zestawy danych zostały użyte do ich opracowania” – zauważył ekspert.
„26 grudnia DeepSeek wypuścił model V3, który w testach porównawczych okazał się bardzo zaawansowany i zdolny do konkurowania z modelami tworzonymi na Zachodzie. Premierze towarzyszył dokument, mówiący o tym, że ostatni trening tego modelu kosztował około 6 mln dolarów” – podkreślił Jęcz.
W jego opinii nie oznacza to jednak, że stworzenie tego modelu kosztuje właśnie tyle. „Nie zrozumiało tego wiele mediów, publikujących takie doniesienia. DeepSeek jedynie podał informację, że koszt obsługi testu końcowego, a więc pracy procesorów, energii – w skrócie: infrastruktury potrzebnej do pracy modelu w momencie ostatnich testów – wynosił właśnie około 6 mln dolarów” – wyjaśnił rozmówca PAP.
Mimo że mowa o teście końcowym, a nie koszcie całego modelu, opublikowane dane uznano za przełomowe. „Koszty testu końcowego modelu V3 okazały się zdecydowanie niższe od tych, jakie towarzyszą modelom tworzonym w USA czy w Europie” – zauważył analityk.
20 stycznia firma opublikowała natomiast model rozumujący, a więc, w uproszczeniu, taki, który symuluje proces logicznego wnioskowania, o nazwie R1. Dodatkowo aplikacja mobilna DeepSeek trafiła na szczyt listy najpopularniejszych darmowych aplikacji w sklepie AppStore. Wszystko to spowodowało spadek wartości akcji spółek z branży AI na rynkach w USA, Europie i Azji.
Jęcz zaznaczył, że DeepSeek rozwinięto w kraju objętym sankcjami, który nie ma dostępu do najnowszej zachodniej technologii. Chiny zostały objęte ograniczeniami już przez administrację poprzedniego prezydenta USA Joe Bidena, która nakładała od 2022 r. na Pekin kolejne restrykcje dotyczące mikroprocesorów, wykorzystywanych do tworzenia rozwiązań z zakresu AI.
„Oznacza to, że firma nie miała prawdopodobnie dostępu do najbardziej zaawansowanych chipów zachodnich, m.in. procesora graficznego NVIDIA H100, stanowiących punkt odniesienia na rynku sztucznej inteligencji” – dodał analityk.
W ocenie eksperta wiarygodność informacji dotyczących kosztu ostatecznego testu modelu V3 jest wysoka.
„Firma DeepSeek jest aktywna w przestrzeni naukowej. Jej prace są opisywane w artykułach naukowych, publikowanych przez inżynierów związanych tym chińskim podmiotem” – zauważył ekspert.
Zachodnie media podejrzewają, że chiński DeepSeek zaniżył koszty i nakłady technologiczne, aby wykazać, że amerykańska branża AI stworzyła bańkę inwestycyjną.
Jednak zdaniem analityka „teoria mówiąca o chińskim ciosie wymierzonym w amerykańskie badania sztucznej inteligencji, chwilę po ogłoszeniu projektu Stargate, jest raczej bezpodstawna”.
„DeepSeek uczestniczy w ożywionej wymianie intelektualnej pomiędzy rynkiem chińskim a amerykańskim, która odbywa się wbrew sankcjom nałożonym na Państwo Środka” – zaznaczył ekspert. Jak dodał, wiarygodność danych opublikowanych przez firmę jest analizowana przez niezależnych zachodnich naukowców.
„Ta sytuacja sugeruje, że zachodnie spółki cyfrowe mogą być przeinwestowane. To właśnie stąd wynikają spadki cen akcji amerykańskich gigantów cyfrowych” – zaznaczył rozmówca PAP.
Wojciech Łobodziński (PAP)
OpenAI uważa, że chiński DeepSeek wykorzystał jej model AI do wyszkolenia swojego chatbota
Amerykańska firma OpenAI oskarżyła chiński startup DeepSeek o wykorzystanie należących do niej zastrzeżonych modeli AI. Miały one posłużyć do wytrenowania sztucznej inteligencji stworzonej przez chińską firmę – poinformował w środę brytyjski dziennik „Financial Times”.
OpenAI zarzuciła DeepSeek naruszenie jej własności intelektualnej, stwierdzając, że znalazła dowody na wykorzystanie metody tzw. destylacji (distillation).
Proces ten „służy do uzyskania lepszej wydajności na mniejszych modelach poprzez wykorzystanie danych wyjściowych z większych, bardziej wydajnych modeli, co pozwala im osiągnąć podobne wyniki w określonych zadaniach przy znacznie niższych kosztach” – wyjaśnił „FT”.
Destylacja jest powszechną praktyką w branży AI. Szczególnie często stosują ją startupy.
W tym przypadku mogła ona jednak zostać użyta przez DeepSeek w celu stworzenia własnego konkurencyjnego modelu, co stanowi naruszenie warunków korzystania z modeli sztucznej inteligencji oferowanych przez OpenAI – podkreślił dziennik.
„Warunki korzystania z usługi stanowią, że użytkownicy nie mogą kopiować żadnego z (jej rozwiązań) ani wykorzystywać danych wyjściowych do opracowywania modeli konkurujących z OpenAI” – podkreślił „FT”.
Amerykańska firma odmówiła dalszych wyjaśnień lub podania szczegółów dotyczących zarzutów wobec DeepSeek. Z kolei chiński startup nie odpowiedział na prośbę dziennika o komentarz.
Akcje firmy NVIDIA spadły w poniedziałek o 17 proc, zmniejszać jej wartość rynkową o 589 mld dolarów. Wiązało się to z opracowaniem nowych modeli AI przez firmę DeepSeek.
Chiński startup miał je rzekomo opracować, bazując na wielokrotnie tańszej technologii niż ta, jaką proponuje NVIDIA, czyli przedsiębiorstwo dostarczające hardware dla wielu firm zajmujących się sztuczną inteligencją, w tym OpenAI. (PAP)
wal/ szm/