<bdo id="vljxk"><rt id="vljxk"><noframes id="vljxk"><noframes id="vljxk"><noframes id="vljxk"><rt id="vljxk"></rt><rt id="vljxk"></rt><noframes id="vljxk"><rt id="vljxk"><delect id="vljxk"></delect></rt><noframes id="vljxk"><rt id="vljxk"></rt><noframes id="vljxk"><noframes id="vljxk"><rt id="vljxk"></rt>

  1. 創業頭條
  2. 前沿領域
  3. 人工智能
  4. 正文

人工智能時代來襲 輸入法如何決勝下一個10年

 2020-05-29 10:05  來源:A5專欄  我來投稿 撤稿糾錯

  阿里云優惠券 先領券再下單

近日,訊飛輸入法新版本正式上線,在隨聲譯和快捷翻譯功能里增加了日譯中、韓譯中、泰、越、西、法、德、俄與中文互譯,合計18種翻譯,這也使得訊飛輸入法成為中文與外語互譯最多的輸入法產品。

不得不說,語音輸入已經越來越受歡迎。艾媒《2019-2020中國第三方手機輸入法市場監測報告》顯示,29%的受訪者表示2019年使用語音輸入的頻率明顯增加,是增長最快的輸入方式。

面對輸入方式的變遷,訊飛輸入法、百度輸入法、搜狗輸入法三大輸入法,也一直在圍繞AI技術不斷加碼語音輸入服務,使其不斷實現準確率的突破,比如訊飛輸入法的語音識別準確率已經高達98%。

輸入法越來越智能的背后,各家的AI技術加持至為關鍵。而面對每天數億次甚至數十億次的使用需求,今天的輸入法產品已經嵌滿了令人意想不到的五彩黑科技。

輸入法的重擔

輸入法越來越智能的代價,就是要背負越來越重的使命。追溯市面上幾款主流輸入法產品的發展歷史,可以發現這些產品已經不年輕,至少都有十年或以上的產品迭代時間。以此推算,輸入法產品與移動互聯網的發展同步,可以說是跟著移動互聯網一路走來的。

最早的輸入法,不論是設備自帶輸入法,還是第三方輸入法,功能普遍比較簡單,比如只支持9鍵和26鍵鍵盤輸入、手寫輸入等非智能機時代沿襲的輸入方式,主要是為了滿足最普遍的用戶需求。

但移動社交、移動趨勢的明晰,以及智能手機的普及,徹底改變了輸入法產品們的發展路徑。個人用戶在多元場景下不斷衍生出更多的輸入需求,開始特別注意到輸入體驗的進步,希望更快和更好,比如能否根據拼音首字母快速預測想打的字。特別是在移動社交場景下,個人用戶使用輸入法的頻率越來越高,用戶對輸入法體驗的感知非常明顯,輸入法好不好用,效率高不高,用戶其實心知肚明。

這讓輸入法的擔子越來越重,原本定位于輕服務工具的輸入法,不得不開始思考如何滿足不同用戶不同場景下的個性化需求。于是,為巨大體量的用戶大規模同步提供優質的輸入服務,成為輸入法產品們發展的核心目標。

愈發全能的輸入法

場景和需求之變,不斷倒逼著輸入法產品的進化,結果就是,輸入法變得越來越全能,越來越精致,越來越個性。以目前的三大輸入法產品為例,十年前的它們與十年后的它們,已經“判若兩人”。

一方面,不斷的功能增加使得產品能夠適應許多輸入場景。除了傳統的手寫和鍵盤輸入外,三大輸入法還加入了OCR掃描、智能預測/糾錯等功能。其中,OCR掃描指的是用戶可以通過掃描將圖片或手寫稿轉換成文字,而智能預測功能則可以提前根據輸入拼音預測用戶想打的字,智能糾錯則可以根據詞庫、語境快速糾正用戶的錯誤。

各種功能的豐富,使得輸入法可以服務于用戶的全輸入過程,在輸入前、中、后每個環節提供對應的服務。

另一方面,產品能力的極限突破為用戶帶來了全面的體驗。以從語音起家的訊飛輸入法為例,目前訊飛輸入法已經做到了一分鐘400字的輸入速度,以及語音識別準確率達98%的水平,也就是說整段輸入的出錯率非常小,為用戶帶來的是極速和流暢的綜合輸入體驗。

可以說,這些功能所達到的極限顛覆了以往低效低質的輸入體驗,從感官上彌補了用戶對輸入法的體驗缺乏。

黑科技成就輸入法

無論是功能上的全能,還是體驗上的全能,輸入法產品能夠實現質變,甚至能夠適應一些極限和極端的輸入場景,除了產品本身的創新外,不斷的技術迭代是最核心的原因。用戶之所以能夠只花一半的時間完成整個輸入過程,都依賴于輸入法們背后的黑科技。

訊飛輸入法可以說是“科技成就輸入法”的最佳代言人。 一方面,其背靠有20多年智能語音技術沉淀的科大訊飛,已有20萬小時訓練數據積累;另一方面,科大訊飛有太多的國際賽事頂尖榮譽,比如在2018年由國際計算語言學協會(ACL)下屬組織主辦的第十二屆國際語義評測比賽(SemEval2018)中,科大訊飛斬獲了基于常識的機器閱讀理解全球第一;2018年的國際權威英文語音識別大賽“CHiME-6”中,科大訊飛包攬了兩項第一名;2019年在ICDAR2019舉辦的場景文本視覺問答挑戰賽ST-VQA中,科大訊飛包攬了三項冠軍;2020年初在德國The 20BN-Jester Dataset手勢識別評測中,科大訊飛以97.26%的準確率斬獲冠軍,且刷新了世界紀錄……訊飛輸入法背后的黑科技可以從四方面來看。

一、語音輸入

語音輸入講究快速和準確,訊飛輸入法之所以能達到一分鐘400字、識別準確率98%的水平,主要在于其自研的“記憶增強的多通道全端到端語音識別框架”,這項技術簡單來說就是能夠完全將前端語音處理過程深度學習化,并使用深度卷積神經網絡和后端識別模型進行混合訓練,從而大大提高了語音識別的效率。

至于能夠使用23種方言進行精準語音輸入,一方面要靠通過多方言共享方式訓練的Multi-lingual多語言建模技術,另一方面要靠GlobalPhone全球音素集,這項技術從聲學層面的相似性來統一各方言的音素定義,使方言“語圖譜”模型進一步精進,從而使得方言識別效果有效提升。多語種互譯功能則對技術提出了更大的挑戰性,以中英互譯為例,訊飛輸入法基于對抗樣本訓練方法提出了融合副語言特征的“高魯棒性語音翻譯技術”,并在模型中結合特定技術,有效提高了最終翻譯結果。

二、拼音輸入

在拼音輸入上,訊飛輸入法創新性引入了Encoder-Decoder框架,構建了新一代拼音識別引擎,極大簡化了傳統拼音識別模型,同時在Attention機制和長短期記憶網絡的門控機制,以及Transformer等模塊的共同作用下,長句輸入識別效果有效提升,能夠提前預測用戶想輸入的內容,還能有效實現智能糾錯。

此外,這一模型由于采用的是序列建模,建模不再依賴詞典,更易實現中英文混合建模,因而讓訊飛輸入法在中英混輸上實現了非常出色混輸表現。值得注意的是,不論是智能預測,還是智能糾錯,背后都有可實時更新的百萬詞庫。

三、手寫輸入

同樣是手寫,體驗卻完全不一樣,這是因為訊飛輸入法的手寫識別可支持兩萬多類中文字符、52類英文字符、10類阿拉伯數字以及100多種特殊符號,這種超級識別能力的背后,是訊飛輸入法的“HWR手寫識別技術”,這項技術采用的是CNN卷積神經網絡技術,可支持實時手寫軌跡,邊寫邊出字,而且單個字符識別僅需15ms,響應迅速無延遲。

四、掃描輸入

掃描輸入的技術支撐是計算機視覺,面對復雜的手寫文字、中英混合文字,“OCR文字檢測技術”可檢測任意方向和形狀的文字,“OCR文字識別技術”則可以有效緩解因環境問題造成的識別效果低下問題。

綜上,基于AI和大數據的組合技術,如今的輸入法不再死板堅硬,即使面對輸入場景的復雜需求,也能夠在不同語種、不同語境、不同語調下滿足不同用戶的需求。過去的輸入法只能輔助,而現在,科技加持下的輸入法,更像是一個“一站式”的輸入管家。

輸入法的智能普惠

黑科技成就了輸入法,也成就了輸入法的地位。根據相關報告提供的數據,以三大輸入法為代表的第三方輸入法,已經覆蓋了超過90%的中國網民。

要是放大到整個輸入法行業,可以說人人都是輸入法的受益者,移動設備也好,個人電腦也好,日常交流必然離不開輸入法的幫助??梢哉f,輸入法已經成為一個互聯網溝通的基礎設施。而且值得慶幸的是,訊飛輸入法等頭部產品在技術上的進化,讓這個基礎設施不斷產生質變,越來越智能。

應該說,像訊飛輸入法這樣始終癡迷于“科技驅動”的輸入法產品,是輸入法作為工具產品在價值上得到躍進式提升的關鍵,因為它們用技術無限拔高了輸入法產品的價值上限。換言之,訊飛輸入法們的“科技大法”一定程度上改善了整個互聯網世界的溝通協作效率。

技術無上限,輸入法產品也無上限。對9.04億中國互聯網網民而言,黑科技持續加持下的輸入法工具,會繼續為每個用戶提供獨一無二的使用體驗,真正實現全方位的智能普惠。

文/劉曠公眾號,ID:liukuang110

申請創業報道,分享創業好點子。點擊此處,共同探討創業新機遇!

相關文章

  • IoT開發者為王,涂鴉智能硬核“靠邊站”

    IoT盛宴:涂鴉向下,產品向上

    標簽:
    人工智能
  • IPO觀察丨黑芝麻智能遞表港交所,車芯行業已邁向量產決戰期?

    雖然我國汽車芯片行業還處在發展初期,但已經迸發出無限潛力。一方面,智能汽車的發展不斷帶動需求增長;另一方面,政策引導下,汽車芯片企業持續搶占高地。對此,在7月5日-7日舉辦的2023年中國汽車論壇上,中國汽車工業協會副秘書長李邵華就做出表示,“中國將成為未來汽車芯片發展的集聚地”。車規芯片行業近日的

    標簽:
    人工智能
  • 倒計時2天丨云天勵飛將亮相世界人工智能大會

    2023世界人工智能大會將于7月6日至8日在上海舉辦。云天勵飛將在大會上展示自主設計開發的新一代邊緣計算芯片DeepEdge10系列SoC芯片,并公布“天書”大模型的最新動態。歡迎蒞臨上海世博展覽館H1-C801展臺參觀交流!同時,云天勵飛也將與中國電子、中國信通院、華為等合作伙伴,在WAIC的舞臺

    標簽:
    人工智能
  • 酷學院智能產品發布會:引領中大型企業學習新潮流

    近日,酷學院智能產品發布會在深圳閃亮登場。近200位現場觀眾和近萬人次在線觀看,共同見證了這一激動人心的時刻。發布會上,酷學院引領大家探索企業培訓學習和人才發展領域的新高度,并揭幕其全新的產品智能升級和突破??釋W院產品負責人徐晨通過形象生動、邏輯嚴謹的講述,揭曉了全新的智能企業培訓和人才發展平臺,以

    標簽:
    人工智能
  • 青少年在科創新活動中受益:人工智能教育開啟未來的可能性

    隨著人工智能技術的快速發展,各行各業都受到了深刻影響,特別是中小學人工智能教育的普及,已經成為當今不可忽視的重要課程。ChatGPT等人工智能技術的出現,讓我們看到了人工智能將成為未來推動科技跨越發展、生產力整體躍升的重要驅動力量之一。在這個背景下,中小學教育已經將人工智能作為重要學習內容,并將科技

    標簽:
    人工智能
  • 百川智能高管集體跑路!王小川的醫療AI還能贏嗎?

    “AI大模型六小虎”百川智能危機重重。這是前搜狗CEO王小川創辦的AI公司。昨天就爆出新聞,百川智能的聯合創始人離職,這是王小川入局AI的第一道大坎。接下的成敗非常關鍵:(1)拿下河北(2)學習科大訊飛百川智能離職高端概覽:(1)2025年7月10日,百川智能技術聯合創始人謝劍將離職。他是百川只能的

  • 百度智能云PaddleOCR 3.1正式發布:關鍵能力支持MCP

    百度AI團隊今日正式推出PaddleOCR3.1版本,以突破性的多語言組合識別(MultilingualCompositionPerception,MCP)技術為核心,徹底重構復雜文檔處理邊界。此次升級標志著OCR領域首次實現對同一文檔內任意混合語言文本的精準識別,為全球化企業、跨境業務及多元文化場

    標簽:
    ai智能
    ai技術
  • 宇樹科技加速沖刺科創板IPO,人形機器人龍頭估值飆至120億元

    “宇樹已形成硬件、算法、場景聯動的業務飛輪,自研率超95%的技術壁壘讓其成為全球機器人賽道不可忽視的中國力量?!笔壮藤Y本管理合伙人朱方文在追加投資時如是評價。7月7日,據每日經濟新聞從宇樹科技投資方處獲悉,國內人形機器人領軍企業宇樹科技(UnitreeRobotics)已明確計劃于科創板IPO,預計

    標簽:
    宇樹科技
  • OpenAI推出GPT-5:AI大統一時代的到來?

    推理與多模態的終極融合,將徹底終結用戶在不同模型間切換的煩惱。7月7日,OpenAI正式確認將在今年夏季推出新一代人工智能模型GPT-5。這一突破性產品將整合現有的多個強大模型,特別是融合專注推理能力的“O系列”與具備多模態功能的“GPT系列”,為用戶提供前所未有的統一體驗。OpenAI開發者體驗負

    標簽:
    chatgpt

編輯推薦