Physical Address
304 North Cardinal St.
Dorchester Center, MA 02124
Physical Address
304 North Cardinal St.
Dorchester Center, MA 02124


Saya telah menggunakan asisten suara selama bertahun-tahun dan meskipun mereka membantu, saya selalu frustrasi ketika mereka memotong saya di tengah kalimat atau benar-benar melewatkan apa yang saya katakan. Saya tidak optimis saat memeriksa mode suara ChatGPT, dan saya tidak terlalu senang jika salah. Mode suara bukan hanya saya berbicara dengan chatbot, ini terasa seperti percakapan autentik.
Ini menangkap jeda, gumaman pikiran, dan bahkan kata-kata pengisi seperti “uhhhh” tanpa merusak alurnya. Baik saat saya sedang mengemudi, memasak, atau mencoba melakukan banyak tugas, saya dapat berbicara secara alami dan mendapatkan jawaban yang berguna tanpa mengangkat telepon. Ini tidak lebih cepat daripada mengetik — terasa lebih mudah, lebih intuitif, dan lebih efisien Jika Anda belum mencobanya, inilah alasan mode suara ChatGPT mungkin menjadi cara favorit Anda untuk menggunakan AI.
jangan lewatkan: Apa itu ObrolanGPT? Semua yang perlu Anda ketahui tentang chatbot AI
obrolangptDari OpenAI, bukan satu-satunya bot obrolan Bebas genggam. milik Google Gemini hidup Menawarkan kesan “bicarakan aku, dan aku akan melanjutkan” yang sama. Claude dari Antropologi Aplikasi selulernya memiliki versi beta dari mode suaranya, lengkap dengan poin-poin di layar saat berbicara, dan Kebingungan Asisten iOS dan Android juga menjawab pertanyaan lisan dan meluncurkan aplikasi seperti OpenTable atau Uber sesuai perintah.
Jangan lewatkan konten teknologi kami yang tidak memihak dan ulasan berbasis laboratorium Tambahkan CNET Sebagai sumber Google pilihan.
Namun meski semua orang berlomba untuk menguasai percakapan AI real-time, ChatGPT mungkin menjadi pilihan saya. Apapun chatbot yang Anda sukai, berhentilah mengetik dan cobalah opsi suara. Ini lebih berguna dari yang Anda kira.
(Pengungkapan: Jeff Davis, perusahaan induk CNET, mengajukan gugatan terhadap OpenAI pada bulan April, menuduh bahwa OpenAI melanggar hak cipta Jeff Davis dalam pelatihan dan pengoperasian sistem AI-nya.)
Lihat ini: Fitur viral ChatGPT: mengubah orang menjadi figur aksi
Obrolan Suara (atau “Percakapan Suara”) adalah mode bebas genggam ChatGPT yang memungkinkan Anda berbicara dengan model AI dan mendengarnya berbicara kepada Anda, tanpa perlu mengetik. Anda akan menemukan ikon suara di aplikasi seluler, desktop, dan web di kanan bawah percakapan apa pun. Jika Anda menekan tombol, Anda dapat mengucapkan pertanyaan Anda dengan lantang dan ChatGPT akan mentranskripsikannya, memberikan alasan dan jawabannya. Segera setelah selesai berbicara, ia mulai mendengarkan lagi, menciptakan dialog bolak-balik yang alami.
ingat saja: Mode suara berjalan pada model bahasa besar yang sama dengan ChatGPT biasa, sehingga masih dapat berhalusinasi atau mendapatkan informasi yang salah. Anda harus selalu memeriksa ulang segala sesuatu yang penting.
OpenAI menawarkan dua versi percakapan suara ini: Suara standar (opsi default gratis dan ringan) dan Suara Tingkat Lanjut (Hanya tersedia untuk pengguna berbayar).
Suara Standar terlebih dahulu mengubah ucapan Anda menjadi teks dan memprosesnya dengan GPT-4o (dan GPT-4o Mini), sehingga membutuhkan waktu lebih lama untuk berbicara dengan Anda. Sebaliknya, Advanced Voice secara asli menggunakan model multimodal, artinya ia “mendengar” Anda dan menghasilkan audio, sehingga percakapan menjadi lebih alami dan dilakukan dalam waktu nyata. Ia dapat menangkap dan menyesuaikan diri dengan isyarat lain selain kata-kata, seperti kecepatan Anda berbicara atau emosi dalam suara Anda.
catatan: Pengguna gratis dapat mengakses pratinjau harian suara yang disempurnakan.
kejutan
1. Ini adalah percakapan nyata
Tidak seperti mengetik, saat saya berbicara dengan ChatGPT, saya tidak mencari kata atau spasi mundur yang tepat setelah setiap kesalahan ketik. Saya hanya berbicara, seperti sedang bersama teman atau anggota keluarga, diisi dengan kata “ummmmm” dan “suka” serta jeda canggung lainnya. Mode suara hadir dengan semua pemikiran saya yang setengah jadi, dan memberikan jawaban atau pertanyaan yang lengkap untuk membantu saya mengisi apa yang saya butuhkan. Memberi dan menerima dengan mudah ini terasa jauh lebih alami daripada mengetik.
2. Anda dapat menggunakan ChatGPT secara handsfree
Tentu saja, saya masih harus membuka aplikasi ChatGPT dan mengetuk tombol mode suara untuk memulai, tetapi begitu saya memulai, saya tidak perlu lagi menggunakan tangan saya untuk melakukan percakapan dengan chatbot AI. Saya bisa terjebak kemacetan dan saya ingin berlibur akhir tahun ini. Saya dapat bertanya tentang penerbangan, hotel, landmark, restoran, dan apa pun tanpa menyentuh ponsel saya, dan percakapan itu disimpan dalam aplikasi, jadi saya tidak perlu mengingat apa yang dikatakan ChatGPT kepada saya.
3. Bagus untuk mempelajari bahasa baru dengan terjemahan waktu nyata
Tadi sudah saya sebutkan bahwa saya menggunakan mode suara untuk latihan bahasa, mode suara itu bagus. Saya berbicara bahasa Inggris dan membalas ChatGPT dalam bahasa Polandia yang sempurna, lengkap dengan tips pengucapan. Tanyakan saja pada Mode Suara, “Bisakah Anda membantu saya melatih (bahasa) saya” dan Mode Suara akan merespons dalam beberapa cara yang dapat membantu Anda, seperti pembuka percakapan, kosakata dasar, atau angka. Dan ia mengingat bagian terakhir yang Anda pelajari, sehingga Anda dapat mengambil pelajaran dengan satu cara; Tidak diperlukan Duolingo.
4. Dapatkan jawaban tentang apa yang Anda lihat di dunia nyata
Fitur ini eksklusif untuk Suara Tingkat Lanjut, tetapi dengan Mode Suara, ini mungkin fitur favorit saya. Berkat kekuatan super multimodalnya, saya dapat menyalakan kamera ponsel atau mengambil video/foto dan meminta ChatGPT membantu saya. Misalnya, saya kesulitan mengenali lukisan yang saya temukan di toko barang bekas dan pemiliknya tidak tahu dari mana asalnya. Saya membuka obrolan suara, menyalakan kamera dan menanyakan mode suara dari mana lukisan itu berasal. Dalam hitungan detik, ia dapat memberi tahu saya judul lukisan, nama seniman, dan waktu lukisannya.
5. Ini adalah pilihan yang baik bagi penyandang disabilitas tertentu
Bagi siapa pun yang memiliki gangguan penglihatan atau disleksia, berbicara jelas lebih baik daripada mengetik. Mode suara dapat menyalin ucapan Anda dan kemudian membacakan balasan Anda dengan keras pada kecepatan yang Anda pilih (Anda dapat menyesuaikannya di pengaturan Anda atau meminta ChatGPT untuk memperlambat). Opsi hands-free membantu siapa pun yang memiliki tantangan keterampilan motorik, karena yang perlu Anda lakukan hanyalah satu ketukan untuk memulai dan satu ketukan lagi untuk berhenti, tanpa harus mengetik terlalu lama di keyboard.
6. Kecerdasan yang cepat
Kadang-kadang saya mendapatkan banyak ide, dan berpikir lebih cepat daripada kemampuan saya mengetik, jadi mode suara ChatGPT sangat cocok untuk melontarkan ide cerita, mencari tahu tata letak baru untuk ruang tamu saya, atau memutuskan makanan menarik untuk dimasak selama seminggu. Karena saya berpikir keras daripada melihat ponsel, ide-ide saya mengalir lebih mudah dan lebih cepat, terutama dengan tindak lanjut instan ChatGPT. Itu menjaga kecepatan sampai saya memiliki ide yang bagus untuk apa pun yang saya pikirkan.
7. Anda dapat mendengarkan ringkasan instan
Masukkan PDF 90 halaman, seperti naskah film atau buku teks, ke dalam obrolan, minta sinopsisnya, dan minta AI membacakannya untuk Anda saat Anda melipat cucian. Ini seperti mengubah dokumen apa pun (bahkan halaman Wikipedia) menjadi podcast — sesuai permintaan.
Mode suara bukan hanya trik yang bagus; Ini adalah cara yang lebih cepat dan alami untuk menggunakan ChatGPT. Baik Anda menerjemahkan rambu-rambu jalan, bertukar pikiran tentang ide, atau menyampaikan berita dengan lantang, berbicara dengan ChatGPT tidak terasa seperti menggunakan chatbot dan lebih seperti percakapan dengan pakar sederhana. Setelah Anda terbiasa berpikir keras, Anda tidak akan pernah kembali ke keyboard Anda.