記者林齊萩/綜合報導
聊天機器人ChatGPT的開發業者OpenAI日前宣布,長期以來僅限於輸入文字提示的生成式人工智慧(AI)平台,將在ChatGPT中推出新的語音和圖片功能,換言之,OpenAI已把視覺、聽覺和說話的能力都賦予ChatGPT。接下來,這些功能將會陸續開放給付費版(ChatGPT Plus)和企業版(ChatGPT Enterprise)用戶。
法新社報導,根據OpenAI說法,付費服務版本中新增的功能可讓用戶與AI對話,甚至「秀出」談論的相關內容。除了語音功能以外,ChatGPT 也加入了圖像辨識功能。
OpenAI提到,語音和影像為大家提供更多在生活中使用ChatGPT的方式。譬如,在旅行時拍下一張地標照片,就能即時討論其中有趣之處。又如,拍照問ChatGPT怎麼把腳踏車座椅調低?或拍冰箱內部照片,請它為做什麼晚餐提供食譜建議,還可拍下複雜的統計圖表,請ChatGPT代為分析。
OpenAI還提到,可使用語音與ChatGPT隨時隨地交談,譬如請它講一個睡前故事,或解決餐桌上的爭論。這家新創公司也說,OpenAI與配音員合作,使得語音互動更逼真。可以像是跟ChatGPT講電話一樣,跟它對談。更可選擇喜歡的聲音,目前有5種可選,包括Breeze(高音女聲)、Juniper(中音女聲)、Sky(低音女聲)、Ember(高音男聲)、Cove(低音男聲)。
根據OpenAI說法,語音和影像功能將在未來幾周內向ChatGPT Plus和Enterprise用戶推出,最後也會進入蘋果(Apple)和谷歌(Google)智慧型手機的作業系統。