• Horyzont.ai
  • Posts
  • 🚀 AI Nie Musi Być Skomplikowane – Oto Twoje AI Hacki!

🚀 AI Nie Musi Być Skomplikowane – Oto Twoje AI Hacki!

PLUS: poradniki do SEO, roboty, tworzenia wektorów – proste, darmowe i efektywne!

🗓 Czwartek 25.01

Witaj w kolejnym wydaniu Horyzont.ai, Twojego kompasu w świecie sztucznej inteligencji.

Nasz newsletter pomoże Ci zacząć korzystać z AI na co dzień oraz nadążyć za nieustannymi nowościami.

~Jakub i Oskar

🎯 W DZISIEJSZYM WYDANIU

  • 🎓 AI od zera do zrozumienia: Co to jest optyczne rozpoznawanie tekstu (OCR)?

  • 🤖 A.I. w praktyce: Darmowe mini-poradniki (SEO, robot, który pracuje gdy śpisz, grafiki wektorowe)

  • 🥷 Prompt Ninja: Realistyczne obrazy

  • 🎓 Twoje Ćwiczenie: Praktyka czyni mistrza

  • 📚 Rekomendowana Biblioteka: Materiały dostępne online.

🕓 Czas czytania: 7min 28s

Wprowadzenie

Jak ChatGPT czyta tekst ze zdjęć?

Dzisiaj przedstawimy Ci co sprawia, że ChatGPT czyta tekst ze zdjęć oraz to, że ChatGPT nie jest jedynym narzędziem na świecie, który tego używa - drugi taki przykład możesz znaleźć w kieszeni Twoich spodni.

Ale jeśli teoria to nie Twoja bajka, to w części praktycznej znajdziesz:

  • AI w SEO: jak dzięki ChatGPT zoptymalizować treści na własnej stronie internetowej. (mini poradnik)

  • Browse.ai: czyli jak stworzyć robota, który skanuje strony internetowe gdy Ty śpisz

  • Jak stworzyć wektorowe grafiki w tym samym stylu za darmo?

A na deser mamy dla Ciebie kolejny mini tutorial na temat tworzenia promptów w Midjourney. Znajdziesz go w sekcji Prompt Ninja 🥷.

AI Od Zera Do Zrozumienia 🎓

Co to jest OCR (optyczne rozpoznawanie tekstu)?

oraz jak jest używane w ChatGPT

Optyczne rozpoznawanie tekstu , znane jako OCR (z ang. Optical Character Recognition) to technologia, która pozwala zamienić różnego rodzaju dokumenty, takie jak zeskanowane papiery, zdjęcia dokumentów czy obrazy z tekstem, w edytowalne i przeszukiwalne dane. Prościej mówiąc, jest to jak umiejętność czytania maszyn – komputer „ogląda” obrazek z literkami i rozpoznaje je, tak jakby miał oczy i umysł człowieka.

Zacznijmy od tego, jak to działa. Wyobraź sobie, że masz stertę starych gazet i chcesz znaleźć artykuł o pierwszym lądowaniu na Księżycu. Możesz spędzić godziny na przeszukiwaniu, albo... użyć OCR. Skanujesz gazety, a oprogramowanie OCR „przegląda” strony, „widzi” i „rozumie” napisane słowa, przekształcając je w tekst, który możesz łatwo wyszukać na komputerze.

źródło: smart engine - przykład użycia OCR w telefonach

To nie magia, to technologia. OCR używa algorytmów rozpoznawania wzorców i uczenia maszynowego, aby dokładnie zidentyfikować litery i słowa na obrazie. Najpierw analizuje kształt każdej litery lub cyfry, następnie porównuje je z zestawem znanych wzorców i decyduje, co najprawdopodobniej zostało zeskanowane.

Teraz, gdy zrozumieliśmy, czym jest OCR, porozmawiajmy o tym, jak możemy go używać. Zastosowań jest mnóstwo: banki używają OCR do czytania czeków, urzędy do digitalizacji formularzy, a biblioteki do zamiany starych książek w e-booki. Nawet twoje urządzenie mobilne prawdopodobnie ma aplikację OCR, która pozwala skanować dokumenty i przekształcać je w pliki PDF.

Ale co to ma wspólnego z ChatGPT? Cóż, ChatGPT, podobnie jak inne zaawansowane systemy AI, może być zasilany danymi przetworzonymi przez OCR. ChatGPT to inteligentny system oparty na języku, który może odpowiadać na pytania, komponować teksty, a nawet pisać kod programistyczny. Aby mógł robić te rzeczy, musi mieć dostęp do dużych ilości tekstu. Tutaj właśnie wkracza OCR - może przekształcać zeskanowane dokumenty w tekst, który potem może być „przeczytany” i zrozumiany przez ChatGPT.

Wyobraź sobie, że masz starą instrukcję do urządzenia, której nigdzie nie możesz znaleźć w internecie. Możesz użyć OCR, aby zamienić zdjęcie tej instrukcji na tekst, a następnie poprosić ChatGPT, aby na jej podstawie wygenerował zrozumiałe dla Ciebie wyjaśnienie, jak coś naprawić lub skonfigurować. Albo, jeśli jesteś naukowcem, możesz przetwarzać artykuły i badania, które nie są jeszcze cyfrowe, a potem używać ChatGPT do analizy i podsumowywania kluczowych informacji.

Poniżej przykład użycia OCR w odczytywaniu antycznych tekstów.

Warto też wspomnieć, że OCR ciągle się rozwija. Badania nad OCR koncentrują się na poprawie dokładności rozpoznawania tekstu w różnych językach i formatach. Naukowcy pracują nad modelami AI, które mogą rozpoznać nawet złożone ręczne pismo, a także nad optymalizacją procesów, aby OCR działało szybciej i była bardziej dostępne dla wszystkich.

AI w Praktyce 🤖

Twórz super zoptymalizowany kontent SEO z ChatGPT  

Znalezienie równowagi między naturalnym a optymalizowanym stylem pisania to wyzwanie, z którym boryka się wielu twórców treści. Jak zatem pisać teksty, które przemówią zarówno do ludzi, jak i algorytmów? Tu na scenę wkracza AI, zmieniając reguły gry.

W tym przypadku wykorzystamy ChatGPT w wersji plus (model GPT-4) i kilka promptów stworzonych pod optymalizację treści podebranych z najważniejszych zasad od ekspertów SEO.


Jeżeli jest to coś czego szukasz, poniżej znajdziesz poradnik:

Browse AI - śledź swoją konkurencje i automatyzuj żmudne zadania z zakresu scrapowania danych 🔎 

Browse AI umożliwia ekstrację konkretnych danych oraz ich moniotorowanie z różnych stron internetowych, takich jak LinkedIn, Indeed, ProductHunt, Eventbrite, Google, Upwork i wielu innych.

Dla mnie najciekawszy jest ten ustawienie monitorowania i otrzymywanie powiadomień o zmianach w wydobytych danych.

Aplikacja ma masę ciekawych zastosowań dzięki dostępnym integracjom takim jak Google Sheets.

Jeżeli jest to coś czego szukasz, poniżej znajdziesz poradnik:

Recraft - twórz grafiki wektorowe za darmo 🖼️

Dzięki recraft.ai możesz tworzyć grafiki wektorowe za darmo. Czym odznacza się recraft? Zachowywaniem stylu, no i oczywiście tym, że jest za darmo 🙂 

  1. Zaloguj się na recraft.ai

  2. Pojawi się przed Tobą mini-poradnik używania ich interfejsu.

  3. Zacznij generować wektorowe obrazki.

Krótki przewodnik po interface recraft.ai (najlepiej przejrzyj go na komputerze, będzie więcej detali, oryginalny tekst jest po angielsku)

Czego możesz spodziewać się w kolejnym wydaniu?

Pokażemy Ci jak za darmo użyć modelu Whisper od OpenAI do przygotowania transkrypcji jakiegokolwiek filmu!

 (COMING SOON) Nasz darmowy poradnik jest już w drodze.⏳️

PSSST…jeśli Whisper to nie jest coś czego szukasz, to daj nam znać w pytaniu o kolejny poradnik w sekcji “Twoje Ćwiczenie” poniżej tego maila.

Prompt Ninja 🥷 

Realistyczne zdjęcia - MidJourney

Wszyscy chyba znamy ten sztuczny wygląd zdjęć wygenerowanych przez MidJourney. Nieważne jakie dodatki dodamy do promptu, np. “ultra realism”, “32k”, “ultra hd”, to zdjęcie i tak wychodzi takie samo. Zaraz Ci powiem jak temu zaradzić.

Poniżej podaje przykład

prompt: a headshot of a woman --ar 16:9 --v 6.0

Ale! Jest na to sposób, wystarczy dodać parę parametrów do zdjęcia i jeden magiczny zwrot. Oto one: taken on phone --s 0 —style raw

Po dodaniu tych parametrów, nasze zdjęcie nabiera ultra realizmu i (moim zdaniem) jest nie do odróżnienia na tle realnych zdjęć. Oto wynik dodania tych parametrów 👇️ 

prompt: a headshot of a woman taken on phone --s 0 --style raw --ar 16:9 --v 6.0

Prompt Tygodnia:

🥱 Basic:
a photo of [PRZEDMIOT/OSOBA], ultra realism, 32k, ultra hd, realism, natural, real photo --ar 16:9 --v 6

🥷 Prompt Ninja:
a photo of [PRZEDMIOT/OSOBA] taken on phone --s 0 --style raw --ar 16:9 --v 6

prompt: president of russia playing football with the president of usa, taken on phone --s 0 --style raw --ar 16:9 --v 6.0

Twoje Ćwiczenie

Praktyka czyni mistrza 🦾 

W tym tygodniu Twoim zadaniem jest rzucić się w wir praktyki. Przygotowaliśmy serię mini poradników, od tworzenia grafik wektorowych po tworzenie własnego robota szperającego po internecie, które pomogą Ci rozpocząć.

Wybierz jedno z narzędzi i zacznij eksperymentować.

Jako alternatywę możesz też przetestować prompty z sekcji Prompt Ninja.

Pamiętaj, choć nie każde narzędzie może być idealne dla Ciebie, warto dać im szansę i zapoznać się z ich możliwościami.

Biblioteka 📚

  1. AI Safety Unplugged: Navigating the Risks Without the Hype | AI House Davos 2024

    Obejrzyj Video

  1. Self-Rewarding Language Models

    Autorzy: Weizhe Yuan, Richard Yuanzhe Pang, Kyunghyun Cho, Sainbayar Sukhbaatar, Jing Xu, Jason Weston
    Opis: W tym artykule dowiesz się o nowym podejściu w uczeniu dużych modeli językowych - polega ono na tym, że model językowy nagradza się sam. Rezultat? Model, który możliwościami przewyższa GPT-4.

    Link do artykułu

To na tyle!

Jeśli masz jakieś ekscytujące pomysły lub projekty, śmiało się z nami skontaktuj, odpowiadając na ten email lub śledząc nas na

💙 Ocena tygodnia:

Do zobaczenia w następnym wydaniu!

~Jakub I Oskar

Zareklamuj swój produkt!
Zasponsoruj kolejne wydanie newslettera!
Czyta nas ponad 1600 osób zainteresowanych AI z różnych sektorów: ludzie z branży technologicznej, przedsiębiorcy, inwestorzy, managerowie, CEO firm!

Napisz do nas!

Reply

or to participate.