Saat ini, banyak lab AI besar sedang mengembangkan AI software agents yang bisa mengoperasikan komputer seperti manusia—melihat layar, membaca tampilan pixel, menggerakkan mouse, dan menekan keyboard. Agen seperti ini disebut Computing User Agents (CUA). Saya pernah menulis detailnya minggu lalu.
CUA terbaik saat ini bisa menyelesaikan sekitar 45% tugas dalam benchmark OSWorld, naik drastis dari hanya 6% ketika benchmark tersebut dibuat enam belas bulan lalu. Lalu, apa yang akan terjadi ketika mereka berhasil mencapai 100%?
Dalam tulisan ini, kita akan membahas apa sebenarnya yang diukur oleh benchmark tersebut, apa yang tidak diukur, dan bagaimana kita harus bersiap ketika AI akhirnya bisa mengeksekusi UI komputer secara sempurna.
Memahami Benchmark CUA
Benchmark OSWorld berisi 369 tugas nyata di desktop, seperti:
-
Mengelola file
-
Browsing web
-
Menggunakan aplikasi secara bersamaan
-
Menyelesaikan workflow di beberapa program
Manusia mampu menyelesaikan sekitar 72–74% dari seluruh tugas ini. Tapi AI mengalami kemajuan cepat:
-
Awal 2025: 17%
-
Hari ini: 45%
-
Perkiraan 2026: AI setara kemampuan manusia
-
Setelah itu: ada yang akan mencapai 100%
Jika suatu hari ada agen AI yang berhasil mendapatkan nilai sempurna, apa artinya?
Nilai 100% hanya membuktikan bahwa AI bisa mengoperasikan UI apa pun.
Itu tidak berarti AI mengerti mengapa tugas tersebut penting, bagaimana menilai risiko, atau bagaimana mengambil keputusan ketika instruksi tidak jelas.
CUA hanyalah mata dan tangan, bukan otak.
Manusia Tetap Jadi Penentu Arah
Walaupun CUA suatu hari bisa menjalankan komputer dengan sempurna, manusia tetap berperan penting. Kita tetap harus:
-
Menentukan tujuan dan maksud
-
Menetapkan batasan, aturan, dan checkpoint
-
Menyelesaikan hal-hal yang ambigu atau butuh penilaian manusia
Artinya, nilai utama nanti bukan pada kemampuan CUA mengeksekusi tugas, tapi pada bagaimana manusia membangun sistem, aturan, dan arahan di sekitarnya.
CUA Akan Menjadi API Universal
Ketika masalah eksekusi UI sudah diselesaikan oleh AI, setiap aplikasi lama di komputer akan berubah menjadi API cerdas. Contohnya:
-
CUA akan bekerja secara deterministik dan berada dalam sandbox (lingkungan terisolasi). Satu tempat kerja = satu CUA.
-
Agen perencana atau reasoning AI akan memutuskan kapan CUA harus dijalankan, apa yang harus dilakukan, dan dengan aturan apa.
Gabungan CUA + agen perencana + aturan organisasi akan membawa kita menuju tahapan kolaborasi AI berikutnya:
-
Tahap 4: AI menggunakan komputer Anda dengan arahan
-
Tahap 5: AI menggunakan komputer tanpa Anda
-
Tahap 6: Banyak agen AI bekerja bersama (multi-agent orchestration)
Karena CUA bekerja dalam ruang kerja yang sudah ada, maka sistem keamanan yang sudah ada seperti IAM, DLP, session recording, dan lainnya tetap bisa digunakan tanpa perlu membuat ulang model keamanan baru.
Bagaimana Kita Bersiap untuk Masa Depan Ini
Jika CUA mencapai kemampuan 100%, itu memang tonggak besar. Tetapi itu bukan akhir, melainkan awal perubahan besar di dunia kerja.
Fokus nilai akan bergeser ke:
-
Bagaimana Anda merancang sistem orkestrasi
-
Bagaimana Anda mengatur keamanan
-
Bagaimana Anda menentukan aturan, batasan, dan kontrol
-
Bagaimana Anda mengatur kapan AI harus mengambil keputusan atau meminta bantuan manusia
Di masa ini, yang paling berharga bukan lagi kemampuan teknis untuk “menggunakan komputer”, tapi kemampuan menilai, memilih strategi, dan mendefinisikan kesuksesan.
Dan itu tetap area yang dikuasai manusia.
Akan terjadi pergeseran besar:
Manusia pindah dari ‘melakukan pekerjaan’ ke ‘mengatur dan mengarahkan pekerjaan’.
Struktur organisasi perusahaan akan lebih mirip graf orkestrasi, di mana manusia memberi tujuan dan AI yang mengeksekusi.
Ketika CUA mencapai tingkat sempurna, satu-satunya antarmuka yang tersisa untuk dioptimalkan adalah:
cara kita berpikir.
Ingin Terlibat Lebih Dalam?
Anda bisa bergabung dalam diskusi di LinkedIn. Semua posting saya juga tersedia di halaman penulis saya di blog Citrix (atau melalui RSS).
Video Terbaru
Pada Mei lalu, saya memberikan keynote dalam konferensi EUCtech Denmark 2025 dengan judul The Future of Work in an AI-Native World, membahas perkembangan AI dan pengaruhnya pada dunia kerja dalam beberapa tahun ke depan. Video tersebut tersedia di YouTube.
Infrastruktur IT yang kuat adalah kunci produktivitas perusahaan. Dengan citrix indonesia, merupakan bagian dari PT. iLogo Indonesia, yang merupakan mitra terpercaya dalam solusi Infrastruktur IT dan Cybersecurity terbaik di Indonesia.
Hubungi kami sekarang atau kunjungi citrix.ilogoindonesia.id untuk informasi lebih lanjut!
