Eksklusif: Peneliti lama Google DeepMind, David Silver, keluar untuk mendirikan startup AI sendiri

(SeaPRwire) –   David Silver, seorang peneliti terkenal yang memainkan peran kritis dalam banyak terobosan paling terkenal perusahaan, telah meninggalkan perusahaan untuk mendirikan startup sendiri.

Silver sedang meluncurkan startup baru bernama Ineffable Intelligence, yang berbasis di London, menurut seseorang yang memiliki pengetahuan langsung tentang rencana Silver. Perusahaan tersebut sedang secara aktif merekrut peneliti AI dan mencari pendanaan modal ventura, kata orang tersebut.

Google DeepMind memberitahu staf tentang keberangkatan Silver awal bulan ini, kata orang tersebut. Silver telah mengambil cuti sabbatical dalam beberapa bulan menjelang keberangkatannya dan tidak pernah secara formal kembali ke peran DeepMind.

Sebagai juru bicara Google DeepMind mengkonfirmasi keberangkatan Silver dalam pernyataan yang dikirim melalui email ke . “Kontribusi Dave sangat berharga dan kami berterima kasih atas dampak yang dia berikan pada pekerjaan kami di Google DeepMind,” kata juru bicara tersebut.

Silver tidak dapat dihubungi segera untuk komentar.

Ineffable Intelligence dibentuk pada November 2025 dan Silver diangkat sebagai direktur perusahaan pada 16 Januari, menurut dokumen yang diajukan ke registri bisnis Inggris Companies House.

Selain itu, halaman web pribadi Silver sekarang mencantumkan kontaknya sebagai Ineffable Intelligence dan menyediakan alamat email ineffable intelligence, meskipun masih menyatakan bahwa dia “memimpin tim pembelajaran penguatan” di Google DeepMind.

Selain pekerjaannya di Google DeepMind, Silver adalah profesor di University College London. Dia masih mempertahankan afiliasi tersebut.

Tokoh kunci di balik banyak terobosan DeepMind

Silver adalah salah satu karyawan pertama DeepMind ketika perusahaan tersebut didirikan pada 2010. Dia mengenal Demis Hassabis, pendiri bersama DeepMind, sejak kuliah. Silver memainkan peran instrumental dalam banyak terobosan awal perusahaan, termasuk prestasi landmarknya pada 2016 dengan , yang menunjukkan bahwa program AI dapat mengalahkan pemain manusia terbaik di dunia dalam permainan strategi kuno Go.

Dia juga merupakan anggota kunci tim yang mengembangkan , program AI yang dapat mengalahkan pemain manusia terbaik di dunia dalam permainan video kompleks Starcraft 2, AlphaZero, yang dapat memainkan catur dan shogi serta Go pada tingkat superhuman, dan , yang dapat menguasai banyak jenis permainan berbeda lebih baik daripada manusia meskipun dimulai tanpa pengetahuan tentang permainan tersebut, termasuk tidak mengetahui aturan permainan.

Baru-baru ini, dia bekerja dengan tim DeepMind yang menciptakan , sistem AI yang dapat menjawab pertanyaan dari Olimpiade Matematika Internasional dengan sukses. Dia juga salah satu penulis pada makalah penelitian 2023 yang memperkenalkan keluarga model AI asli Google Gemini. Gemini sekarang menjadi produk dan merek AI komersial terkemuka Google.

Mencari jalur menuju kecerdasan super AI

Siliver telah memberitahu teman-temannya bahwa dia ingin kembali ke “kagum dan keajaiban menyelesaikan masalah terberat dalam AI” dan melihat kecerdasan super—atau AI yang akan lebih pintar daripada manusia manapun dan berpotensi lebih pintar daripada seluruh umat manusia—tantangan terbesar yang belum terpecahkan di bidang ini, menurut orang yang familiar dengan pemikirannya.

Beberapa peneliti AI terkenal lainnya juga telah meninggalkan laboratorium AI mapan dalam beberapa tahun terakhir untuk mendirikan startup yang didedikasikan untuk mengejar kecerdasan super. Ilya Sutskever, mantan ilmuwan utama di OpenAI, mendirikan perusahaan bernama Safe Superintelligence (SSI) pada 2024. Perusahaan tersebut dalam pendanaan modal ventura sampai saat ini dan dilaporkan memiliki nilai sampai $30 miliar. Beberapa rekan Silver yang bekerja pada AlphaGo, AlphaZero, dan MuZero juga baru-baru ini meninggalkan untuk mendirikan Reflection AI, startup AI yang juga mengatakan sedang mengejar kecerdasan super. Sementara itu, tahun lalu sekitar “Superintelligence Labs” baru yang dipimpin oleh mantan CEO dan pendiri Scale AI, Alexandr Wang.

Melampaui model bahasa

Silver terkenal dengan pekerjaannya pada pembelajaran penguatan, cara melatih model AI dari pengalaman daripada data historis. Dalam pembelajaran penguatan, model mengambil tindakan, biasanya dalam permainan atau simulator, lalu menerima umpan balik apakah tindakan tersebut produktif membantu mencapai tujuan. Melalui trial and error selama banyak tindakan, AI mempelajari cara terbaik untuk mencapai tujuan.

Peneliti tersebut sering dianggap sebagai salah satu pendukung paling dogmatis pembelajaran penguatan, yang berargumen bahwa itu adalah satu-satunya cara untuk menciptakan kecerdasan buatan yang suatu hari nanti dapat melampaui pengetahuan manusia.

Pada podcast yang diproduksi oleh Google DeepMind yang dirilis pada bulan April, dia mengatakan bahwa model bahasa besar (LLMs), jenis AI yang bertanggung jawab atas sebagian besar kegembiraan baru-baru ini tentang AI, sangat kuat, tetapi mereka juga dibatasi oleh pengetahuan manusia. “Kami ingin melampaui apa yang manusia ketahui dan untuk melakukan itu kami akan membutuhkan jenis metode yang berbeda dan jenis metode itu akan membutuhkan AI kami untuk benar-benar menyelesaikan hal-hal sendiri dan menemukan hal-hal baru yang manusia tidak ketahui,” katanya. Dia telah menyerukan “era pengalaman” baru dalam AI yang akan didasarkan pada pembelajaran penguatan.

Saat ini, LLMs memiliki fase pengembangan “pretraining” yang menggunakan apa yang disebut pembelajaran tanpa pengawasan. Mereka menyerap banyak teks dan belajar memprediksi kata mana yang secara statistik paling mungkin mengikuti kata lain dalam konteks tertentu. Mereka kemudian memiliki fase pengembangan “post-training” yang menggunakan beberapa pembelajaran penguatan, seringkali dengan evaluator manusia melihat output model dan memberikan umpan balik ke AI, kadang hanya dalam bentuk jempol ke atas atau ke bawah. Melalui umpan balik ini, kecenderungan model untuk menghasilkan output yang membantu meningkat.

Tetapi jenis pelatihan ini pada akhirnya bergantung pada apa yang manusia ketahui—baik karena bergantung pada apa yang manusia telah pelajari dan tuliskan di masa lalu pada fase pre-training maupun karena cara LLMs melakukan post-training dengan pembelajaran penguatan pada akhirnya berdasarkan preferensi manusia. Namun, dalam beberapa kasus, intuisi manusia bisa salah atau picik. 

Contohnya, terkenal, pada langkah 37 dari pertandingan kedua AlphaGo pada 2016 melawan juara dunia Go Lee Sedol, AlphaGo membuat langkah yang sangat tidak konvensional sehingga semua ahli manusia yang berkomentar tentang permainan tersebut yakin itu adalah kesalahan. Tetapi nantinya terbukti menjadi kunci AlphaGo memenangkan pertandingan itu. Demikian juga, pemain catur manusia sering menggambarkan cara AlphaZero bermain catur sebagai “alien”—namun langkah-langkahnya yang bertentangan dengan intuisi sering terbukti brilian.

Jika evaluator manusia memberikan penilaian pada langkah-langkah seperti itu dalam jenis proses pembelajaran penguatan yang digunakan dalam post-training LLM, mereka mungkin memberikan “jempol ke bawah” pada langkah-langkah tersebut karena bagi ahli manusia tampak seperti kesalahan. Ini alasan mengapa puris pembelajaran penguatan seperti Silver mengatakan bahwa untuk mencapai kecerdasan super, AI tidak hanya harus melampaui pengetahuan manusia, tetapi juga perlu membuangnya dan belajar mencapai tujuan dari awal, bekerja dari prinsip-prinsip dasar.

Silver telah mengatakan bahwa Ineffable Intelligence akan bertujuan untuk membangun “kecerdasan super yang belajar tanpa henti yang menemukan dasar-dasar semua pengetahuan sendiri,” kata orang yang familiar dengan pemikirannya. 

Artikel ini disediakan oleh penyedia konten pihak ketiga. SeaPRwire (https://www.seaprwire.com/) tidak memberikan jaminan atau pernyataan sehubungan dengan hal tersebut.

Sektor: Top Story, Daily News

SeaPRwire menyediakan distribusi siaran pers real-time untuk perusahaan dan lembaga, menjangkau lebih dari 6.500 toko media, 86.000 editor dan jurnalis, dan 3,5 juta desktop profesional di 90 negara. SeaPRwire mendukung distribusi siaran pers dalam bahasa Inggris, Korea, Jepang, Arab, Cina Sederhana, Cina Tradisional, Vietnam, Thailand, Indonesia, Melayu, Jerman, Rusia, Prancis, Spanyol, Portugis dan bahasa lainnya.