OpenAI stellt EVMbench vor: Test von KI-Agenten an 120 Smart-Contract-Schwachstellen

OpenAI hat EVMbench gestartet, um zu bewerten, wie KI-Agenten Sicherheitslücken in Krypto-Smart Contracts erkennen, beheben und ausnutzen. Am Mittwoch veröffentlichte das Unternehmen gemeinsam mit Paradigm und OtterSec ein Paper zu 120 Schwachstellen. Darin führte Claude Opus 4.6 von Anthropic mit einem "detect award" von $37,824 vor OC-GPT-5.2 und Gemini 3 Pro.