Meta zaprezentowała absolutną nowość. Ich system sztucznej inteligencji ImageBind potrafi łączyć dane z zupełnie różnych od siebie źródeł.
Sztuczna inteligencja to najgorętszy temat tego roku. Nic zresztą dziwnego – jej możliwości cały czas szokują. Programy oparte na głębokich sieciach neuronowych bardzo skutecznie naśladują już działanie ludzkiego mózgu i tworzą bardzo realistyczne rzeczy. Większość z nich opiera się jednak na prostych transformacjach danych. ChatGPT tworzy tekst na podstawie tekstu. Midjourney i DALL-E tworzą za to obrazu na tej samej podstawie.
ImageBind od Mety działa w zupełnie inny sposób – jest w stanie precyzyjnie łączyć dane pochodzące z różnych zakresów w jedną rzecz. Konkretniej, łączy on tekst, dźwięk, obraz oraz dane pochodzące z czujników takich jak kamery 3D, czujniki temperatury i promieniowania podczerwonego czy czujniki ruchu oraz przyspieszenia. Tak naprawdę, nasz mózg ma bardzo podobne możliwości – komputer nie czuje jedynie smaku oraz zapachu.
Sprawdź: Czy sztuczna inteligencja zabierze ci prace?
Co ciekawe, Meta postawiła na dość niecodzienne jak na nich rozwiązanie. ImageBind jest projektem open-source! Jego możliwość są naprawdę olbrzymie – będzie w stanie przewidywać rzeczy niedostępne dla innych systemów AI. Na podstawie obrazu oceni, jak mogła brzmieć przedstawiona na nim scena albo jaka była wtedy temperatura. Po samym dźwięku pozna natomiast chociażby gatunek ptaka i pokaże nam jego zdjęcie.
Oczywiście, to bardzo podstawowe zastosowania. Tak naprawdę, ImageBind będzie niesamowicie przydatny w IoT i w zagadnieniach takich jak inteligentne miasta. Tak szeroka integracja danych z wielu różnych czujników pozwoli tworzyć niesamowite modele.
Zobacz też:
Prompt engineering – co to jest? Czy to zawód przyszłości?
Meta wprowadza płatną weryfikację na Facebooku i Instagramie
IBM zastąpi 8 tysięcy pracowników sztuczną inteligencją