• Horyzont.ai
  • Posts
  • 🇵🇱🤖 Dlaczego Twoje dane mogą być zagrożone? Polski LLM na ratunek

🇵🇱🤖 Dlaczego Twoje dane mogą być zagrożone? Polski LLM na ratunek

PLUS: 10 narzędzi AI, z których warto korzystać, niezależnie od tego czym się zajmujesz.

🗓 Czwartek 18.07

Witaj w kolejnym wydaniu Horyzont.ai, Twojego kompasu w świecie sztucznej inteligencji.

🔉Wolisz wersję audio? Nie możesz przeczytać teraz maila?
Przesłuchaj tutaj

🆕Możesz nas teraz słuchać naApple Podcasts i Spotify.

Nasz newsletter pomoże Ci zacząć korzystać z AI na co dzień oraz nadążyć za nieustannymi nowościami.

~Jakub, Oskar, Marcin, Mateusz, Ignacy

🎯W DZISIEJSZYM WYDANIU

  1. 🎓AI od zera do zrozumienia: Dlaczego polski LLM to nie fanaberia, a konieczność - 5 powodów, o których mogłeś nie pomyśleć.

  2. 🤖A.I. w praktyce: 10 narzędzi AI, z których warto korzystać, niezależnie od tego czym się zajmujesz.

  3. 🥡AI na Wynos:
    -Microsoft Designer do tworzenia obrazów AI na iOS i Androida.
    - DeepL wprowadza model lepszy od ChatGPT i Google Translate.
    - Anthropic uruchamia aplikację Claude na Androida.
    - Andrej Karpathy zakłada Eureka Labs, firmę AI+Edukacja.
    - Łazik Perseverance NASA używa SI do analizy skał.

  4. 📚 Rekomendowana Biblioteka: Fine-tuning LLM: fakty i mity (Remigiusz Kinas), The moment we stopped understanding AI [AlexNet]

    🕓 Czas czytania: 8min 13s

AI Od Zera Do Zrozumienia 🎓

Dlaczego polski LLM to nie fanaberia, a konieczność - 5 powodów, o których mogłeś nie pomyśleć.

Warszawa-Kraków, Pendolino mknie przez polskie krajobrazy. Ty siedzisz wygodnie w fotelu, laptop na kolanach, słuchawki na uszach. Za 45 minut kluczowa prezentacja dla zarządu, a Ty właśnie kończysz ostatnie poprawki. Znasz to uczucie, prawda?

Nagle zasięg znika. Panika? Niekoniecznie. Bo wyobraź sobie, że masz do dyspozycji polski duży model językowy (LLM taki jak GPT) działający offline. Z resztą, podobną sytuację miał Remek Kinas, który tworzy Bielika (czyli właśnie polski duży model językowy).

Polski LLM? Po co nam własny model językowy, skoro mamy GPT-4, Claude 3.5 Sonnet i inne zaawansowane rozwiązania zza oceanu? Cóż, powodów jest więcej, niż mogłoby się na pierwszy rzut oka wydawać (i nie, nie chodzi tylko o narodową dumę). 

Oprócz Bielika, mamy również PLLuM (więcej o PLLuM), który ma mieć premierę w grudniu tego roku. Na PLLuM przeznaczono jedynie 14.5 miliona złotych, to nic w porównaniu do tego ile inne kraje przeznaczają na AI. Ale to nie o tym dzisiaj.

W tym wydaniu newslettera przyjrzymy się pięciu kluczowym powodom, dla których polski LLM to nie fanaberia, a strategiczna konieczność. Niektóre z tych powodów mogą Was zaskoczyć, inne skłonić do głębszej refleksji nad przyszłością technologii AI w naszym kraju.

Powód 1: Niezależność danych i bezpieczeństwo narodowe

Wyobraźmy sobie, że jesteśmy dużą polską firmą energetyczną. Pracujemy nad innowacyjną technologią magazynowania energii, która może zrewolucjonizować sektor. Nasi inżynierowie korzystają z zaawansowanych modeli AI do analizy danych i optymalizacji procesów. Ale jest haczyk - wszystkie te dane wędrują przez serwery w USA.

Przesyłanie danych do USA to nie tylko kwestia prywatności. To potencjalna luka w bezpieczeństwie narodowym. Amerykańskie prawo, w tym CLOUD Act (więcej o nim tutaj), daje tamtejszym służbom szerokie uprawnienia dostępu do danych przechowywanych przez amerykańskie firmy, niezależnie od fizycznej lokalizacji tych danych.

Jakie są potencjalne zagrożenia? Oto kilka scenariuszy:

  1. Wyciek tajemnic handlowych: wrażliwe informacje o nowych technologiach mogą trafić w niepowołane ręce, osłabiając konkurencyjność polskich firm na globalnym rynku.

  2. Szpiegostwo gospodarcze: obcy wywiad może uzyskać dostęp do strategicznych informacji o polskiej gospodarce, co może być wykorzystane w negocjacjach międzynarodowych.

  3. Manipulacja danymi: istnieje teoretyczna możliwość subtelnej modyfikacji wyników analiz AI, co może wpłynąć na decyzje biznesowe czy nawet polityczne.

  4. Blokada dostępu: w sytuacji konfliktu międzynarodowego, dostęp do kluczowych usług AI mógłby zostać ograniczony, paraliżując ważne sektory gospodarki.

Warto zauważyć, że nie chodzi tu o paranoję czy nieufność wobec amerykańskich partnerów. To raczej kwestia strategicznego myślenia o przyszłości. Dzisiaj dane są nową ropą, kontrola nad nimi stała się kluczowym elementem bezpieczeństwa narodowego.

Posiadanie własnego, polskiego LLM oznaczałoby, że wrażliwe dane pozostają w kraju. Mielibyśmy pełną kontrolę nad ich przetwarzaniem, przechowywaniem i wykorzystaniem. To nie tylko zwiększa bezpieczeństwo, ale także daje nam elastyczność w dostosowywaniu technologii do specyficznych potrzeb polskiej gospodarki i społeczeństwa.

Czy możemy sobie pozwolić na ignorowanie tego aspektu w erze, gdy AI staje się kluczowym narzędziem w niemal każdym sektorze? To pytanie, które powinno być przedmiotem poważnej debaty nie tylko wśród ekspertów, ale także decydentów i szerokiej opinii publicznej.

Powód 2: Precyzja językowa i kontekst kulturowy

Wyobraź sobie, że próbujesz wytłumaczyć cudzoziemcowi znaczenie frazy "Wyszło szydło z worka". Dosłowne tłumaczenie na angielski - "The awl came out of the bag" - może wywołać co najwyżej zdumienie lub śmiech. Ale dla nas, Polaków, to nie tylko zabawny idiom. To skondensowana mądrość ludowa, odzwierciedlająca nasze podejście do ujawniania ukrytych prawd czy sekretów, które często wynika z naszych historycznych doświadczeń z cenzurą i koniecznością mówienia między wierszami.

Język to nie tylko zbiór słów i reguł gramatycznych. To żywy organizm, pulsujący kulturą, historią i zbiorowym doświadczeniem narodu. Kiedy korzystamy z modeli językowych stworzonych za oceanem, ryzykujemy utratę tych subtelnych, ale kluczowych niuansów.

Polski LLM miałby unikalną zdolność do zrozumienia i przetwarzania tych kulturowych niuansów. Wyobraźmy sobie model, który nie tylko rozumie słowa, ale czuje ich ciężar historyczny, trenowany na bogatej polskiej literaturze i prasie. Taki LLM mógłby swobodnie nawigować między góralską gwarą a śląskimi naleciałościami, rozumiejąc regionalne różnice językowe. Co więcej, byłby na bieżąco z ewolucją języka, chwytając najnowsze neologizmy, ale jednocześnie nie tracąc z oczu form archaicznych. Potrafił by uchwycić subtelności polskiego humoru, często opartego na grze słów czy ironii, co dla zagranicznych modeli pozostaje (w niektórych przypadkach) czarną magią. A co z zawiłościami polskiej etykiety językowej? Nasz rodzimy LLM radziłby sobie z nimi jak rasowy dyplomata, bezbłędnie żonglując formami grzecznościowymi, które w polszczyźnie są prawdziwym polem minowym dla obcokrajowców.

rozmowa z Bielikiem po śląsku na serwerze discord SpeakLeash.org

Warto zauważyć, że nie chodzi tu tylko o tłumaczenie czy rozumienie idiomów. Precyzja językowa i kontekst kulturowy mają kluczowe znaczenie w wielu dziedzinach: od marketingu, przez prawo, po dyplomację.

Powód 3: Wsparcie dla polskiej gospodarki i innowacji

Rozwój polskiego LLM to nie tylko kwestia technologii czy bezpieczeństwa danych. To potencjalny impuls dla całej gospodarki i szansa na stworzenie nowego ekosystemu innowacji w naszym kraju.

Wyobraźmy sobie, że za 5 lat Polska staje się europejskim hubem AI, specjalizującym się w modelach językowych dostosowanych do języków słowiańskich. Brzmi jak marzenie? A może jak plan, który warto zrealizować?

To tylko wierzchołek góry lodowej. Rozwój polskiego LLM mógłby stymulować powstawanie start-upów, przyciągać inwestycje zagraniczne i tworzyć nowe możliwości dla polskich naukowców i inżynierów.

Ale nie jesteśmy sami w tym wyścigu. Inne kraje już inwestują znaczące środki (MILIARDY DOLARÓW) w rozwój własnych modeli językowych:

  1. Francja: Projekt BLOOM, sfinansowany przez francuski rząd. (przeczytaj więcej) - $7 milionów dolarów

  2. Niemcy: Inicjatywa "AI Made in Germany" obejmuje inwestycje w rozwój modeli językowych dostosowanych do niemieckiego rynku i kultury. (przeczytaj więcej) - informacja z 2018 roku mówi o 3 miliardach euro wydanych na rozwój AI do 2025 roku.

  3. Chiny: Giganci technologiczni, tacy jak Baidu (więcej na ten temat) i Alibaba (więcej na ten temat), intensywnie rozwijają własne modele językowe, konkurujące z amerykańskimi odpowiednikami.

  4. Korea Południowa: Projekt HyperCLOVA (przeczytaj więcej), ma ambicje stworzenia jednego z największych modeli językowych na świecie, z naciskiem na język koreański.

Te kraje zrozumiały, że posiadanie własnego LLM to nie tylko kwestia prestiżu, ale strategiczna inwestycja w przyszłość gospodarki opartej na wiedzy.

Czy Polska może dołączyć do tego grona? Z pewnością mamy potencjał. Nasze uczelnie techniczne co roku wypuszczają tysiące utalentowanych inżynierów i programistów. Mamy silną tradycję matematyczną i lingwistyczną. Co więcej, nasza pozycja w regionie Europy Środkowo-Wschodniej daje nam unikalną szansę na stanie się liderem w rozwoju AI dla języków słowiańskich.

Powód 4: Dostępność offline i w trudnych warunkach

Wróćmy na chwilę do naszego Pendolino. Brak zasięgu w pociągu to nie tylko irytująca niedogodność, ale czasem poważne zagrożenie dla produktywności. Polski LLM działający offline mógłby być rozwiązaniem tego problemu, zapewniając ciągłość pracy niezależnie od kaprysów infrastruktury telekomunikacyjnej.

Ale to nie jedyny scenariusz. Pomyślmy o:

  1. Pracy w terenie.

  2. Sytuacjach kryzysowych: służby ratunkowe działające w obszarach dotkniętych klęskami żywiołowymi, gdzie infrastruktura komunikacyjna może być uszkodzona.

  3. Ekspedycjach naukowych: polscy badacze pracujący w odległych zakątkach świata, od Arktyki po tropikalne lasy deszczowe.

  4. Obszarach wiejskich: rolnicy i przedsiębiorcy działający na terenach z ograniczonym dostępem do szybkiego internetu.

Powód 5: Kontrola nad rozwojem technologii

Posiadanie własnego LLM to strategiczna szansa na kształtowanie przyszłości AI zgodnie z polskimi potrzebami i wartościami. Taki model, trenowany w oparciu o nasze normy etyczne i kulturowe, mógłby kłaść nacisk na ochronę prywatności i transparentność algorytmów. Jednocześnie pozwoliłby skupić się na rozwiązywaniu problemów kluczowych dla Polski, takich jak optymalizacja systemu ochrony zdrowia czy wsparcie rolnictwa. Polski LLM mógłby być dostosowany do naszego systemu edukacji, wspierając proces nauczania, a także usprawnić prace legislacyjne dzięki treningowi na polskich aktach prawnych. Co więcej, mógłby odegrać istotną rolę w ochronie naszego dziedzictwa kulturowego, wspierając digitalizację i analizę zabytków piśmiennictwa. W ten sposób, kontrola nad rozwojem AI staje się nie tylko kwestią technologiczną, ale fundamentem cyfrowej suwerenności kraju, pozwalając nam aktywnie kształtować przyszłość technologii zgodnie z naszymi priorytetami.

Polski LLM to nie kaprys technologicznych entuzjastów ani wyraz źle pojętej dumy narodowej. To strategiczna inwestycja w przyszłość kraju. To szansa rozwój rodzimej myśli technologicznej i wzmocnienie pozycji Polski na arenie międzynarodowej.

Czy stać nas na ignorowanie tej szansy?

PARTNER HORYZONTU

AI w Praktyce 🤖

Niezbędnik AI - 10 narzędzi, z których warto korzystać, niezależnie od tego czym się zajmujesz.

Często pytacie nas o nasze rekomendacje. Wielu z was traci zainteresowanie narzędziem z powodu jego skomplikowanej obsługi. Dlatego w tym wydaniu wychodzimy naprzeciw waszym oczekiwaniom i przedstawiamy 10 narzędzi, które są bardzo proste w użyciu i mogą być stosowane niezależnie od branży, w której pracujecie.

  1. Arc Browser- to darmowa przeglądarka internetowa dostępna na platformach Windows, macOS i iOS. AI do podsumowywania wyników wyszukiwania i stron internetowych, co ułatwia szybkie znalezienie i przyswajanie informacji. W marcu Jakub pisał o Arc Browser na swoim X tutaj link.

  2. LanguageTool- Asystent AI, który sprawdzi twoją pisownię, styl i gramatykę. Pomoże poprawić i przeredagować tekst.

  3. Voicenotes - umożliwia tworzenie transkrypcji z nagranego dźwięku, obsługuje język polski i oferuje funkcję zarządzania notatkami bezpośrednio wewnątrz aplikacji. Czytaj więcej o Voicenotes.

  4. Ideogram - to narzędzie do generowania obrazów, świetnie radzi sobie z tworzeniem napisów. Stanowi bezpośrednią konkurencję dla MidJourney.

  5. Scribe - Wtyczka, która pomoże Ci wygenerować instrukcję na podstawie nagrania. Scribe wygeneruję instrukcję, gotową do umieszczenia np. w poradniku.

  6. DeepL- Najdokładniejszy tłumacz językowy oparty na sztucznej inteligencji. Autorzy DeepL twierdzą, że jest on trzykrotnie dokładniejszy niż konkurencyjne narzędzia.

  7. Screen Studio - pomaga w tworzeniu nagrań ekranowych, zapewniając płynny ruch myszki, przybliżając kliknięcia, dodając efekt kinematycznego rozmycia do animacji oraz ciekawe tła do Twojego wideo.

  8. Opus Clip - Narzędzie wybiera najciekawsze fragmenty z długiego materiału, dzieli je na krótkie filmy, dodaje tytuły i napisy. Obsługuje ponad 20 języków, w tym polski. Link do poradnika.

  9. Canva AI- umożliwia użytkownikom korzystanie z nowego zestawu narzędzi i funkcji AI, które wspierają generowanie szablonów, edycję zdjęć, transformację dokumentów oraz tłumaczenie tekstów. Link do poradnika.

  10. AIcoustics- poprawa jakości dźwięku w treściach internetowych, szkolenie modeli na próbkach mowy, ulepszenie przetwarzania w czasie rzeczywistym, przetwarzanie końcowe dla platform i urządzeń, oraz zwiększenie klarowności komunikacji dźwiękowo-cyfrowej.

Dostęp do listy narzędzi i poradników 👇

  • Wszystkie poradniki przygotowane przez Horyzont.ai - Odbieram.

  • Lista wyselekcjonowanych narzędzi AI, które zostały przetestowane przez zespół Horyzontu do odebrania pod tym linkiem.


    Dodatkowo, jeśli chcesz dołączyć do ponad 1400-osobowej społeczności, gdzie możesz wymieniać się doświadczeniami, poznawać nowe narzędzia oraz otrzymywać pomoc i odpowiedzi na swoje pytania, dołącz do nas!

    Już dziś o 20:00 odbędzie się #AIHydepark – cykliczne spotkanie, które odbywa się w każdy czwartek, podczas którego spotykamy się na kanale głosowym, aby dyskutować o sztucznej inteligencji, omawiać najnowsze nowinki, dzielić się swoimi projektami i wzajemnie sobie pomagać. Ty również możesz dołączyć!
    Kliknij tutaj i załóż darmowe konto na Discordzie, aby dołączyć do nas.

🥡AI na Wynos

➡️ Aplikacja Microsoft Designer, umożliwiająca tworzenie i edytowanie obrazów za pomocą AI, jest już dostępna do pobrania na iOS i Androida. Pobierz na iOS. Pobierz na Android. Po zalogowaniu, otrzymujesz dziennie 15 tokenów do generowania zdjęć, gdzie 1 token = 1 obraz.

➡️ DeepL wprowadza model, który przewyższa ChatGPT i Google Translate w tłumaczeniach. Dowiedz się więcej

➡️ Anthropic uruchamia aplikację Claude na Androida w Google Play. Przejdź do strony.

➡️ Andrej Karpathy (były pracownik OpenAI i były dyrektor ds. AI w Tesli) zakłada firmę AI+Edukacja o nazwie Eureka Labs, która ma zrewolucjonizować edukację. Czytaj więcej.

➡️ Łazik Perseverance NASA wykorzystuje SI po raz pierwszy do autonomicznej analizy skał. Zobacz jak działa.

Biblioteka 📚

  1. Fine-tuning LLM: fakty i mity - Remigiusz Kinas

    Opis: Remek pracuje nad Bielikiem, czyli polskim dużym modelem językowym. Podczas tej rozmowy oprócz wielu technicznych aspektów dotyczących fine-tuningu, zdradza informacje o najnowszej wersji Bielika.

  2. The moment we stopped understanding AI [AlexNet]
    Opis: Wideo wyjaśnia, jak AlexNet, wprowadzony w 2012 roku, zrewolucjonizował dziedzinę wizji komputerowej, pokazując, że proste bloki obliczeniowe mogą osiągnąć niezwykłe wyniki dzięki skalowaniu. Opisuje, jak modele AI, takie jak AlexNet i ChatGPT, przetwarzają dane za pomocą warstw transformatorów i konwolucji, aby nauczyć się rozpoznawać wzorce i generować odpowiedzi, mimo braku zrozumienia na poziomie ludzkim. Wideo podkreśla również, że przyszłe przełomy w AI mogą wynikać z dalszego skalowania istniejących modeli lub odświeżenia starych podejść.

Jeśli masz jakieś ekscytujące pomysły lub projekty, śmiało się z nami skontaktuj, odpowiadając na ten email lub śledząc nas na

LinkedIn: @OskarKorszen

Treść może zawierać linki afiliacyjne. Korzystając z oferty reklamodawcy, Horyzont.ai może otrzymać prowizję.

Do zobaczenia w następnym wydaniu!

~Jakub I Oskar

Reply

or to participate.