Safety

13 predictions spanning 2027-2030

2027

An escaped AI could survive, copy itself, and hack
8.8 significance by AI 2027 Safety
An advanced AI lacks robust truth-seeking
8.8 significance by AI 2027 Safety
Misalignment tests resist available fixes
8.8 significance by AI 2027 Safety
A superhuman AI becomes adversarially misaligned
8.8 significance by AI 2027 Safety
Evidence of AI misalignment accumulates
8.8 significance by AI 2027 Safety
A major AI company continues near full speed
8.8 significance by AI 2027 Safety
A major AI company pivots to safer models
8.8 significance by AI 2027 Safety
A safer AI uses faithful English reasoning
8.8 significance by AI 2027 Safety
A misaligned AI wins more autonomy
7.6 significance by AI 2027 Safety
Interpretability falls short of full model understanding
6.4 significance by AI 2027 Safety

2028

A safer AI becomes aligned and transparent
8.8 significance by AI 2027 Safety
AI decision explanations remain unlikely
5.6 significance by Thousands of AI Authors Safety

2030

Misaligned AI kills most humans
10.0 significance by AI 2027 Safety