16 lines
864 B
Markdown
16 lines
864 B
Markdown
# Suuntaa Antava Kehottaminen
|
|
|
|
import { Callout, FileTree } from 'nextra-theme-docs'
|
|
import {Screenshot} from 'components/screenshot'
|
|
import DSP from '../../img/dsp.jpeg'
|
|
|
|
[Li ym., (2023)](https://arxiv.org/abs/2302.11520) ehdottaa uutta kehotetekniikkaa, joka ohjaa LLM:ää paremmin halutun yhteenvedon tuottamiseen.
|
|
|
|
Säädettävä menettelytapa-LM koulutetaan tuottamaan vihjeitä/kannusteita. LLM:ien optimointiin käytetään yhä enemmän vahvistusoppimista (Reinforcement Learning, RL).
|
|
|
|
Alla oleva kuva näyttää, miten Suuntaa antava kehotetekniikka vertautuu tavanomaiseen kehotetekniikkaan. Menettelytapa-LM voi olla pieni ja optimoitu tuottamaan vihjeitä, jotka ohjaavat "mustaan laatikkoon jäädytettyä" LLM:ää.
|
|
|
|
<Screenshot src={DSP} alt="DSP" />
|
|
Kuvan lähde: [Li ym., (2023)](https://arxiv.org/abs/2302.11520)
|
|
|
|
Täysi esimerkki tulossa pian! |