• Ostatnia modyfikacja artykułu:2 dni temu

Wikipedia udostępnia darmowe dane do szkolenia AI. Wszystko po to, żeby trochę odpuścili w końcu ich przegrzanym serwerom.

Największa internetowa encyklopedia świata – Wikipedia – mierzy się z nietypowym i coraz poważniejszym wyzwaniem. Rosnące zainteresowanie ze strony systemów sztucznej inteligencji powoduje przeciążenia serwerów i obniża komfort korzystania z serwisu dla zwykłych użytkowników. Scrapery stale pobierają treści – teksty, obrazy, dane – by zasilać narzędzia takie jak chatboty czy inteligentne asystenty. Skutki? Większe zużycie zasobów serwerowych i zauważalne spowolnienia działania strony.

W odpowiedzi na rosnące obciążenie, Wikimedia Foundation postanowiła zaproponować alternatywę: zamiast blokować dostęp, udostępnia dane w sposób zorganizowany i przystosowany do potrzeb twórców AI.Fundacja rozpoczęła współpracę z platformą Kaggle (należącą do Google), czego efektem jest nowy, otwarty zbiór danych zaprojektowany z myślą o uczeniu maszynowym. Pierwsza wersja dostępna jest w języku angielskim i francuskim, a jej celem jest dostarczenie zasobów AI bez konieczności ciągłego wyszukiwania ich na stronie Wikipedii.

Udostępnione dane obejmują m.in. streszczenia artykułów, skrócone opisy, struktury podobne do infoboxów oraz odnośniki do grafik. Szybkie, lekkie, przyjemne i do prostego pobrania bez obciążania całej infrastruktury Wikipedii. Co ważne jest też etycznie – danych objęty jest otwartymi licencjami – Creative Commons lub domeną publiczną. Oznacza to pełną dostępność zarówno dla osób prywatnych, jak i firm komercyjnych, pod warunkiem zachowania odpowiedniej atrybucji.

Wikipedia w ten sposób podkreśla też jasno swoje stanowisko: rozwój technologii nie powinien odbywać się kosztem jakości usług dla internautów. Dzięki udostępnieniu danych w uporządkowanej formie możliwe jest zmniejszenie presji na infrastrukturę.

Zobacz też:
Wikipedia jest zalewana przez AI – problem jest poważny.
OpenAI chce stworzyć własny portal społecznościowy
Jakich zawodów nie zastąpi sztuczna inteligencja? Kogo nie dotknie automatyzacja?

Oceń ten post