Deepseek R2 zdeklasuje GTP-4o?

Ostatnia modyfikacja artykułu:1 rok temu

A jednak da się zrobić to taniej. Deepseek R2 może zmiażdżyć nowy model GPT-4o pod względem kosztów pracy.

W sieci przybywa spekulacji dotyczących kolejnej generacji modelu od DeepSeek. Nowy projekt, oznaczony jako R2, może okazać się przełomowy — przede wszystkim ze względu na swoją cenę, która ma być wyraźnie niższa niż w przypadku GPT-4o. DeepSeek już wcześniej udowodniło, że chińska technologia AI może konkurować z zachodnimi rozwiązaniami. Może jeszcze nie jakoś definitywnie, ale na pewno są już wyzwaniem z którym trzeba się liczyć.

Na początek fakty. Jedną z ciekawszych informacji jest to, że 82% infrastruktury modelu R2 oparto na układach Huawei Ascend 910B. DeepSeek zdecydowało się więc uniezależnić od amerykańskich gigantów technologicznych, co może mieć strategiczne znaczenie. Od strony technicznej DeepSeek R2 bazuje na zmodyfikowanej architekturze Mixture of Experts. Nowy system ma zarządzać aż 1,2 biliona parametrów, co stanowi prawie dwukrotny wzrost względem poprzedniego modelu, R1.

Sprawdź też: Prompt engineering – co to jest? Czy to zawód przyszłości?

A teraz spekulacje, choć poparte solidnymi podejrzeniami. Największym atutem R2 może być jego ekstremalnie niska cena. Według wstępnych informacji, koszty jednostkowe na token w nowym modelu mają być aż o 97,3% niższe niż w przypadku GPT-4o.

Oficjalna prezentacja DeepSeek R2 dopiero przed nami, a wszystkie obecne doniesienia należy traktować z dystansem. Jednak biorąc pod uwagę udany debiut R1, można podejrzewać, że R2 też będzie dość udane. Tylko pytanie czy aż tak bardzo jak jest to obecnie reklamowane.

Zobacz też:
OpenAI chce stworzyć własny portal społecznościowy
DeepSeek: 20 lat więzienia za korzystanie z chińskiego AI?
ChatGPT – uprzejmość użytkowników kosztuje miliony dolarów