首頁—正文
分享到:
?诔蔀槭着珖鴶祿䴓俗⒃圏c城市
2024年05月27日 10:52 來源:海口日報
5月22日,在百度智能云(?冢┤斯ぶ悄芑A數據產業(yè)基地,數據標注師正忙著為人工智能領域提供強大的數據支持。本報記者 石中華 攝
5月22日,在百度智能云(?冢┤斯ぶ悄芑A數據產業(yè)基地,數據標注師正忙著為人工智能領域提供強大的數據支持。本報記者 石中華 攝

  □本報記者陳麗園 王子豪

  數據標注是人工智能算法得以有效運行的關鍵環(huán)節(jié),數據標注師則像人工智能(AI)的眼睛,帶它看世界,理解世界,快速成長。5月26日上午,走進?跀底挚萍紕(chuàng)新平臺的百度智能云(?)人工智能基礎數據產業(yè)基地(下稱“?诨亍),上千名大模型數據標注師正忙著為人工智能領域提供強大的數據支持。

  去年8月,我市與百度開展政企合作,在秀英區(qū)建設?诨。今年5月24日,國家數據局公布了首批7家全國數據標注試點基地名單,?诔蔀槲沂∥ㄒ蝗脒x城市。

  打造大模型時代AI數據服務矩陣

  “它很聰明,給的建議非常實用!碑斕焐衔纾诤?诨亍拔男囊 言”產品展示區(qū),一幕幕人機對話的場景,引得現場體驗者連連稱贊。

  被大家點贊的“文心一言”,是?诨卦谌珖氏忍剿鞔笳Z言模型標注能力的典型應用場景,為我市數字經濟產業(yè)發(fā)展注入了強大動力。據百度統(tǒng)計,“文心一言”用戶規(guī)模已達2億,日均調用量也達到了2億,高效滿足了用戶工作、生活和學習需求。

  “高速發(fā)展的大模型產業(yè)為數據標注帶來了新的機遇,這就需要一支龐大且專業(yè)的團隊!焙?跀底挚萍紕(chuàng)新平臺運營經理何靜介紹,?诨刂饕薪幼匀徽Z言處理等大語言模型相關業(yè)務,這也是百度首家專攻大模型的數據標注基地!拔磥砘貙⒊掷m(xù)培養(yǎng)AI訓練師、模型精調師、指令工程師等,形成大模型時代AI數據服務矩陣!焙戊o說。

  “基地落地運營以來,有力推動了我市數據服務產業(yè)集聚和數據人才培育!毙阌^(qū)科工信局相關負責人表示,下一步將繼續(xù)加強數據標注產業(yè)的培育和發(fā)展,計劃在未來3到5年圍繞基地打造數字園區(qū),打造人工智能“新基建”數據底座,推動數據標注產業(yè)向更高層次、更廣領域發(fā)展。

  先行先試促進人工智能產業(yè)發(fā)展

  “我的工作主要是結合用戶提出的問題,為大模型生成的文本回答進行打分,從而提高大模型的‘智商’!碑斕欤诤?诨剞k公室里,“00后”數據標注師陳澤哲正在顯示器前熟練操作。

  百度智能云服務商海南拓明云海科技有限公司項目負責人莫志恒介紹,海口基地的數據標注師具備通識性、專業(yè)領域知識能力,可高質量承接SFT、RM、評估等多類標注任務。截至今年5月,?诨乜偨ㄔO規(guī)模達11400平方米,入駐本地數據標注企業(yè)9家,現場從業(yè)人員達1000余人,基地年產值有望突破5000萬元。

  大力發(fā)展數據服務產業(yè),必須不斷夯實數字基礎設施。當天,記者在位于海口江東新區(qū)的中國移動(海南?)自貿港IDC項目現場看到,施工人員正在仔細檢查電纜安裝情況、測試各項指標,該項目計劃今年6月竣工驗收。而中國電信海南(?)國際信息園已于去年底投產試運營。2個項目正式投產運營后,將開展智算、游戲出海、智慧醫(yī)療、數字保稅等多項業(yè)務。今年1月?谌脒x國家“千兆城市”。在數據安全有序方面,全省通過國家網信辦數據出境安全評估的2家企業(yè)均為我市注冊企業(yè)。

  市科工信局相關負責人表示,我市將以試點為契機,在數據標注產業(yè)的生態(tài)構建、能力提升和場景應用等方面先行先試,進一步集聚龍頭企業(yè),為促進人工智能產業(yè)生態(tài)發(fā)展提供有力支撐。

編輯:李奧迪