Why Nostr? What is Njump?
2024-06-10 02:06:27

satuser on Nostr: นักวิจัย เล่าประสบการณ์ train Claude 3 ...

นักวิจัย เล่าประสบการณ์ train Claude 3

Amanda Askell จบทางปรัชญามา และรับหน้าที่ fine-tune เพื่อสร้างบุคลิกให้กับ Claude โดยเทคนิค RLAIF ตามเกณฑ์บุคลิกที่เรากำหนด เช่น สงสัยใฝ่รู้, เปิดกว้าง, ช่างคิด งานตรงนี้มีความยาก ไม่สามารถใช้คำตอบง่ายๆ ได้

"Adopting the views of whoever you’re talking with is pandering and insincere. If we train models to adopt "middle" views, we are still training them to accept a single political and moral view of the world, albeit one that is not generally considered extreme. Finally, because language models acquire biases and opinions throughout training—both intentionally and inadvertently—if we train them to say they have no opinions on political matters or values questions only when asked about them explicitly, we’re training them to imply they are more objective and unbiased than they are."

บทความ: https://www.anthropic.com/research/claude-character

source : https://www.facebook.com/share/GGb6vF1brqc7Rk3i

#siamstr #claudestr #AI #philosophy
https://youtu.be/iyJj9RxSsBY
Author Public Key
npub1e9vcz6204fft6jxvyf0edd3a54t8n9znz007h94mmwlkqlqeulzqfjj93f