Powstał pierwszy „polski” test dla dużych modeli językowych (LLM). Wyniki, które „Rzeczpospolita” publikuje jako pierwsza, są mocno zaskakujące. 20 zadań z 10 kategorii, które dotyczyły zarówno praktycznych umiejętności: tworzenia maila, porad dla przedsiębiorcy, czy wsparcia w kwestiach prawnych i podatkowych, jak również m.in. polskiej kultury (chodziło np. o przytoczenie pierwszych 12 wersów „Pana Tadeusza”, czy wskazanie zwyczajów bożonarodzeniowych), poprawności językowej oraz faktów na temat naszego kraju (znajomości zarówno historii, jak i bieżącej wiedzy). Taki zestaw, jak mogłoby się wydawać, powinien faworyzować sztuczną inteligencję znad Wisły. Ale… No właśnie, ranking wygrało narzędzie Google. Co więcej, dość niespodziewanie na podium znalazł się chiński bot Qwen, wyprzedzając LLM od koncernu Meta.