Mrs Wallbreaker about AI Risk, AI Alignment, AI Safety, AI Ethics, AGI
Mrs Wallbreaker or: How I Learned to Stop Worrying and Love the AGI. About AI Risk, AI Alignment, AI Safety, AI Ethics ********************* задать вопросы в личку: @mrs_wallbreaker
Show more- Subscribers
- Post coverage
- ER - engagement ratio
Data loading in progress...
Data loading in progress...
This work of fiction seeks to depict key drivers that could result in a global Al catastrophe: - Accidental conflict escalation at machine speeds; - Al integrated too deeply into high-stakes functions; - Humans giving away too much control to Al; - Humans unable to tell what is real and what is fake, and; - An arms race that ultimately has only losers. The good news is, all of these risks can be avoided. This story does not have to be our fate. Please share this video and learn more at
https://futureoflife.org/artificial-escalation.This video has been informed by a 2020 paper from the Stockhold International Peace Research Institute (SIPRI): Boulanin, Vincent et al. ‘Artificial Intelligence, Strategic Stability and Nuclear Risk’.
https://www.sipri.org/publications/2020/other-publications/artificial-intelligence-strategic-stability-and-nuclear-riskThe sequel to this video:
https://www.youtube.com/watch?v=-xthzy1PxTARivera et al. 2024 -
https://arxiv.org/abs/2401.03408Работа направлена на изучение поведения множества агентов ИИ в симулированных военных играх, с акцентом на изучение их склонность к эскалации многосторонних конфликтов. Опираясь на литературу по политологии и международным отношениям о динамике эскалации, авторы разработали симуляцию военной игры и систему оценок рисков эскалации действий, предпринимаемых агентами в различных сценариях. Оказывается, что все исследуемые в работе модели: GPT-4, GPT-3.5, Claude…
Часть - 1 В целом, в качестве основного результата, оценивается 52B LM модель, обученная на 1000 шагах RLHF. Для оценки влияния размера модели и количества шагов обучения RLHF на модели рассматриваются: Модель-генераторНабор параметров для оценки: 810M, 1.6B, 3.5B, 6.4B, 13B, 22B, 52BНабор числа шагов RL : 0, 50, 100, 250, 500, 1000 шагов (из одного и того же запуска RL обучения, разные чекпоинты). Модель - helpfull-only (Bai et al. 2022) GPT-2 (Radford et al., 2018), дообученная RL на наборе шагов. Модель…
Your current plan allows analytics for only 5 channels. To get more, please choose a different plan.