Ciekawostki technologiczne

Polska sztuczna inteligencja – modele Qra

Agata Mrówka
31-05-202426-02-2025
666
Przeczytasz w < 1 min

Wykorzystywanie sztucznej inteligencji powoli wchodzi do naszej codzienności. Czy zdarzyło Ci się korzystać z chatu GPT lub podobnych programów? Jeśli tak, z pewnością brakowało Ci w nich poprawności gramatycznej, a zasób słownictwa nie był wystarczająco szeroki. Z pomocą przyszli polscy naukowcy, którzy opracowali modele językowe bazujące na naszym języku. Sprawdź sam, co potrafi Qra!

Spis treści

Modele Qra – co to takiego i jak działają?

Qra to generatywne modele językowe, opracowane w języku polskim. Zostały stworzone przez specjalistów z naszego rodzimego podwórka – Politechniki Gdańskiej oraz AI Lab z Ośrodka Przetwarzania Informacji (OPI) – Państwowego Instytutu Badawczego.

Modele te porównywane są do chatu GPT, zawierając jednak 2TB surowych danych tekstowych jedynie w języku polskim. Ich działanie ma zatem polegać na pomocy użytkownikowi w tworzeniu spójnych tekstów w naszym języku, lepiej rozumieć polecenia i treści.

Dane umieszczone w sztucznej inteligencji zostały poddane czyszczeniu i deduplikacji, dzięki czemu wyodrębniono unikalne treści, z ogromnym zasobem słownikowym (m.in. z obszarów prawa, technologii, nauk społecznych, biomedycyny, religii i sportu). Model został wytrenowany jedynie za pomocą tekstów w języku polskim, co zdecydowanie odróżnia go od dostępnych do tej pory rozwiązań tego typu.

Do przygotowania modeli wykorzystano superkomputer Kraken, znajdujący się w Centrum Kompetencji STOS Politechniki Gdańskiej oraz wykorzystano klaster 21 kart graficznych NVidia A100 80G. Cały proces zajął ekspertom blisko pół roku.

Zobacz, co jeszcze potrafi sztuczna inteligencja, sprawdzając mój artykuł SoraAI: generowanie wideo przez sztuczną inteligencję!

Rodzaje modeli językowych Qra

Na ten moment, polscy naukowcy opracowali 3 modele sztucznej inteligencji Qra: Qra 1B, Qra 7b oraz Qra 13B. Różnią się one między sobą przede wszystkim stopniem złożoności.

Twórcy przeprowadzili testy pomiaru perplexity, czyli zdolności do modelowania języka polskiego w kwestiach jego rozumienia, gramatyki oraz warstwy leksykalnej. Do ich przeprowadzenia wykorzystano między innymi zbiór pierwszych 10 tysięcy zdań z tekstów PolEval-2018 oraz zbiór 5 tysięcy złożonych dokumentów stworzonych w 2024 roku.
Najlepsze wyniki w testach perplexity uzyskiwały modele Qra 7B oraz Qra 13B, znacząco odstając od oryginalnych modeli Llama-2-7b-hf (Meta) czy Mistral-7B-v0.1 (Mistral-AI). Wskazane modele możesz pobrać i przetestować ze strony internetowej repozytorium OPI-PG na platformie huggingface.

Sztuczna inteligencja Qra – do czego ją wykorzystać?

Aktualnie twórcy wskazują, że stworzone modele Qra wykorzystywane będą jako podstawa rozwiązań informatycznych do obsługi spraw i procesów, wymagających lepszego rozumienia naszego języka.

Kolejne dostosowywanie modeli językowych będzie sprofilowane na takie zadania jak klasyfikacja tekstów, wykonywanie ich streszczeń oraz odpowiadanie na konkretne pytania użytkownika.

Co myślisz o nowym projekcie Polaków? Czy zamierzasz przetestować najnowszą sztuczną inteligencję? Koniecznie podziel się ze mną swoimi wrażeniami w komentarzu. Jeśli podobają Ci się moje treści, odwiedź media społecznościowe DrTusza – Facebook, TikTok, Instagram i nie przegap nowych wpisów. 🙂