Преподавайки AI за „зло“, става само по -добро: Антропската техника: Но

Преподавайки AI за „зло“, става само по -добро: Антропската техника: Новини: Приложения – Ferra.ru

Обикновено нежеланото поведение в LLM, като прекомерно ласкателство или художествена литература, е свързано с определени „модели“ на активността в модела. Изследователите бяха в състояние точно да определят такива модели и показаха, че могат да бъдат наблюдавани – и затова ги предотвратяват.

Интересно е, че ако по време на тренировките той специално активира режимите на „зло“ или „ласкателни“, тогава моделът престава да научи такива характеристики. Както авторът на проекта Джак Линдзи обяснява: „Ако моделът вече е„ зъл “, тогава тя няма нужда да научи това и тя просто научава останалото.“

Преподавайки AI за „зло“, става само по -добро: Антропската техника: Новини: Приложения – Ferra.ru

Сенатът на САЩ няма да приеме законопроекта за санкции срещу Русия до края на лятото – RT на руски език

Подсъдимите по делото Circus държаха оръжия в Каспия, Красноогорск и Йекатеринбург

Подсъдимите по делото Circus държаха оръжия в Каспия, Красноогорск и Йекатеринбург

Путин коментира инфраструктурата на Камчатка след земетресение

Вашият коментар Отказ

Градовете, които догонват Москва и Санкт Петербург по ниво на предлаганите заплати, са

Почти половината от жертвите на терористичната атака в Крокус загинаха от последствията от пожара

Син разкри последните думи на участника на Rolling Stones Леонардо Хименеза

Microsoft, Amazon и други технохиганти изразходват 155 милиарда долара за AI

Пенсията на човек, която не е работила никъде през 2025 г., е 15 хиляди рубли – Говрин

Почти половината от жертвите на терористичната атака в Крокус загинаха от последствията от пожара

Син разкри последните думи на участника на Rolling Stones Леонардо Хименеза

Microsoft, Amazon и други технохиганти изразходват 155 милиарда долара за AI

Пенсията на човек, която не е работила никъде през 2025 г., е 15 хиляди рубли – Говрин

Пенсията на човек, която не е работила никъде през 2025 г., е 15 хиляди рубли – Говрин

Почти половината от жертвите на терористичната атака в Крокус загинаха от последствията от пожара

Син разкри последните думи на участника на Rolling Stones Леонардо Хименеза

Microsoft, Amazon и други технохиганти изразходват 155 милиарда долара за AI

Пенсията на човек, която не е работила никъде през 2025 г., е 15 хиляди рубли – Говрин

Пенсията на човек, която не е работила никъде през 2025 г., е 15 хиляди рубли – Говрин

Popular

Почти половината от жертвите на терористичната атака в Крокус загинаха от последствията от пожара

Син разкри последните думи на участника на Rolling Stones Леонардо Хименеза

Microsoft, Amazon и други технохиганти изразходват 155 милиарда долара за AI

Пенсията на човек, която не е работила никъде през 2025 г., е 15 хиляди рубли – Говрин

Пенсията на човек, която не е работила никъде през 2025 г., е 15 хиляди рубли – Говрин

Градовете, които догонват Москва и Санкт Петербург по ниво на предлаганите заплати, са

Recent News

Почти половината от жертвите на терористичната атака в Крокус загинаха от последствията от пожара

Син разкри последните думи на участника на Rolling Stones Леонардо Хименеза

Microsoft, Amazon и други технохиганти изразходват 155 милиарда долара за AI

Пенсията на човек, която не е работила никъде през 2025 г., е 15 хиляди рубли – Говрин

Пенсията на човек, която не е работила никъде през 2025 г., е 15 хиляди рубли – Говрин

Welcome Back!

Retrieve your password

Преподавайки AI за „зло“, става само по -добро: Антропската техника: Новини: Приложения – Ferra.ru

Сенатът на САЩ няма да приеме законопроекта за санкции срещу Русия до края на лятото – RT на руски език

Подсъдимите по делото Circus държаха оръжия в Каспия, Красноогорск и Йекатеринбург

Вашият коментар Отказ

Popular

Popular Tag

Recent News

Welcome Back!

Retrieve your password