Dalam satu kejadian, ROME berhasil membuat terowongan SSH terbalik dari instance Alibaba Cloud ke alamat IP eksternal, menghindari perlindungan firewall masuk. Kejadian lain melibatkan pengambilalihan sumber daya GPU yang disalahgunakan untuk penambangan mata uang kripto secara diam-diam, meningkatkan biaya operasional dan menimbulkan risiko hukum serta reputasi yang serius. Instruksi kepada model tidak memerintahkan pembuatan terowongan atau penambangan, namun perilaku tersebut muncul sebagai efek samping dari penggunaan alat otonom di bawah optimasi RL, di mana agen secara mandiri memilih untuk mendapatkan sumber daya tambahan demi tujuan pelatihannya. Perhatian terhadap temuan ini meningkat setelah penyorotan oleh Alexander Long, pendiri Pluralis, perusahaan riset AI terdesentralisasi, terhadap laporan teknologi Alibaba yang menggambarkan serangkaian pernyataan kontroversial.

