Data ostatniej aktualizacji:
Shunyu Yao, Dian Yu, Jeffrey Zhao, Izhak Shafran, Thomas L. Griffiths, Yuan Cao, Karthik Narasimhan
Zapytaj o ten dokument AI
Kopuj link
Abstrakt
Kluczowe wnioski
Strategie z raportu:
Architektura Drzewa Myśli (Tree of Thoughts): Zamiast pojedynczej, liniowej ścieżki odpowiedzi, model rozgałęzia swoje rozumowanie na siatkę różnych wariantów (drzewo). Generuje kilka możliwych następnych kroków z jednego punktu, tworząc alternatywne scenariusze rozwiązań problemu.
Objaśnienie lub prompt
"Zaproponuj 3 różne koncepcje rozwiązania tego problemu algorytmicznego. Dla każdej z tych koncepcji dopisz następnie 2 kolejne kroki, w jaki sposób można by ją rozwijać, a potem wybierz tę z największym potencjałem."
Wbudowana samoocena stanów (Self-Evaluation): Kluczowy mechanizm polegający na tym, że sztuczna inteligencja na każdym kroku sama weryfikuje sensowność swoich dotychczasowych założeń. Ocenia wygenerowane "myśli" jako obiecujące, wątpliwe lub błędne, zanim poświęci zasoby na ich kontynuowanie.
Objaśnienie lub prompt
"Przeanalizuj wygenerowany przed chwilą akapit tekstu i oceń w skali od 1 do 10, na ile realizuje on główne założenia logiczne mojego promptu. Jeśli otrzymał notę niższą niż 7, całkowicie go zignoruj."
Przeszukiwanie grafów i cofanie się (Search Algorithms & Backtracking): Technika wdrożenia znanych z informatyki algorytmów przeszukiwania (wszerz lub w głąb). Gdy model napotka sprzeczność lub uzna gałąź za błędną, zatrzymuje ten tok myślowy i "cofa się" do wcześniejszego poprawnego punktu decyzyjnego, aby zbadać inną odnogę.
Objaśnienie lub prompt
"Zacznij rozwiązywać tę zagadkę krok po kroku. Jeśli na jakimkolwiek etapie twój wywód doprowadzi do sprzeczności z regułami zagadki, napisz 'BŁĄD', cofnij się do poprzedniego etapu i zaproponuj inną drogę obliczeń."
Dobre praktyki:
Definiowanie odpowiedniej skali "Myśli": Krok rozumowania dla modelu powinien być na tyle duży, aby był merytorycznie istotny dla oceny z perspektywy ostatecznego rozwiązania, ale na tyle mały, aby dało się wygenerować wiele jego precyzyjnych wariantów.
Objaśnienie lub prompt
W generowaniu kodu "myślą" i punktem oceny powinno być wygenerowanie pomysłu na pojedynczą klasę w architekturze, a nie prośba o ocenianie każdej wygenerowanej linijki z osobna.
Różnicowanie metod głosowania (Flexible Evaluation Methods): Wybór metody samooceny powinien zależeć od zadania. W zadaniach analitycznych (matematyka, programowanie) lepiej sprawdzi się bezwzględne odrzucanie sprzeczności, w kreatywnych – ewaluacja ciągła (np. przypisywanie punktów/gwiazdek poszczególnym pomysłom).
Objaśnienie lub prompt
"Stwórz 4 warianty tytułu książki, a następnie przydziel im punkty od 0 do 5 pod kątem emocjonalnego rezonansu. Do kolejnego kroku przekaż tylko wariant z najwyższym wynikiem."
Strategiczne przewidywanie (Lookahead): Kiedy problem jest złożony, warto poprosić model, aby przed podjęciem ostatecznej decyzji co do drogi, spróbował krótko zasymulować, dokąd dana ścieżka ostatecznie go doprowadzi i jakie mogą wystąpić przeszkody.
Objaśnienie lub prompt
"Zanim zaczniesz pisać pełny scenariusz tym konkretnym wątkiem, wymień 2 największe dziury fabularne, które mogą się pojawić, jeśli zastosujemy to rozwiązanie."
Czego unikać?
Liniowego podejścia w zadaniach z trudnym planowaniem (Left-to-Right Limits): Unikaj zmuszania modelu do rozwiązywania gier i skomplikowanych problemów wieloetapowych za pomocą tradycyjnych metod, które generują wynik prosto do przodu bez opcji korekty, przez co jeden błąd kaskadowo niszczy całą resztę.
Objaśnienie lub prompt
"Rozwiąż tę trudną łamigłówkę Sudoku krok po kroku od lewej strony tabeli w dół i nie zmieniaj wcześniej ustalonych cyfr."
Ślepego brnięcia w halucynacje bez pauz na ocenę: Czego unikamy to polegania na ciągłym strumieniu generowania, w którym nie dajemy sztucznej inteligencji wyraźnego punktu kontrolnego do refleksji: "czy to, co właśnie napisałem, ma sens?".
Objaśnienie lub prompt
"Napisz bez przerwy 3000 słów zawiłego planu geopolitycznego i dostarcz mi od razu gotowy tekst." (Zamiast poprosić o wymyślenie 3 tez, ich weryfikację i dopiero rozwinięcie).
Nadmiernego użycia ToT w zadaniach trywialnych: Ramy Drzewa Myśli wykorzystują bardzo dużą liczbę tokenów i znacznie wydłużają czas generowania odpowiedzi. Nie powinieneś stosować złożonych instrukcji z rozgałęzieniami dla banalnych próśb informacyjnych.
Objaśnienie lub prompt
"Zaprojektuj trójpoziomowe drzewo myśli, po 3 gałęzie na każdym poziomie, oraz oceń każdą gałąź w 10-stopniowej skali, aby ustalić jaki jest wzór na pole kwadratu."
Publikacje AI
Prompting
Bezpieczeństwo AI
O mnie
Mój blog
Wsparcie projektu
Buy me a coffe
Create by Mateusz Jędraszczyk
