Amanda Askell จบทางปรัชญามา และรับหน้าที่ fine-tune เพื่อสร้างบุคลิกให้กับ Claude โดยเทคนิค RLAIF ตามเกณฑ์บุคลิกที่เรากำหนด เช่น สงสัยใฝ่รู้, เปิดกว้าง, ช่างคิด งานตรงนี้มีความยาก ไม่สามารถใช้คำตอบง่ายๆ ได้
"Adopting the views of whoever you’re talking with is pandering and insincere. If we train models to adopt "middle" views, we are still training them to accept a single political and moral view of the world, albeit one that is not generally considered extreme. Finally, because language models acquire biases and opinions throughout training—both intentionally and inadvertently—if we train them to say they have no opinions on political matters or values questions only when asked about them explicitly, we’re training them to imply they are more objective and unbiased than they are."
บทความ: https://www.anthropic.com/research/claude-character
source : https://www.facebook.com/share/GGb6vF1brqc7Rk3i
#siamstr #claudestr #AI #philosophy
quoting note10p9…rn85https://youtu.be/iyJj9RxSsBY