重慶首個數據集建設應用基地落戶永川

9月28日,人工智能高質量數據集生態發展大會在重慶市永川區舉行。會上,重慶市大數據應用發展管理局與永川區政府簽署協議,共同建設“重慶市數據集建設應用基地”。這也是全市首個數據集建設應用基地。
此次落戶永川的“重慶市數據集建設應用基地”,將聚焦建強公共數據標注平台,全面提升數據集建設能力。市大數據局將支持永川屬地企業參與重慶城市可信數據空間的數據集建設,在資源對接、實施交付、標注工具能力提升等方面提供支持﹔將支持永川建立適配超大城市現代化治理需求的數據標注治理流程,提升數據標注效率與可用性,有效支撐全市AI能力體系和業務場景。
會上,西部數據標注研究院、西部數據集生產基地也同步揭牌成立。
西部數據標注研究院是由中國信息協會與永川區政府共同發起成立的數字技術共享平台、數字產業孵化平台及數字生態構建平台。研究院將聚焦人工智能與數字重慶建設雙向賦能,圍繞人工智能、高質量數據集、數據標注等領域,開展新興技術科研創新、頂層設計、課題研究、標准制定、質量評測等業務,並組建專家智庫,培養復合型數據標注人才。
西部數據集生產基地由中國信息協會與永川區政府共建。協會將依托會員企業資源,推動更多數據集生產類企業落地永川,雙方合力促成數據要素在永川匯集,打造基地以帶動西部、輻射全國數據產業。
永川作為重慶市數字經濟發展的重要承載區,近年來依托重慶雲谷·永川大數據產業園,積極承接國家“數據要素×”行動計劃,將數據標注產業作為推動數字經濟和實體經濟深度融合的重要抓手,至今已集聚數據標注類企業18家,建成標注坐席1.2萬席,2024年相關業務營收達13.76億元,佔到了全市總量的65%,並成為西南地區最大的數據標注產業基地。(新重慶-重慶日報記者 周雨)
新聞多一點>>>
數據集和數據標注是什麼
二者是人工智能和機器學習領域最核心最基本的概念。
數據標注是一個過程,指的是對原始數據(如圖片、文本、音頻、視頻)進行加工,為其添加有意義的標簽或注釋,以告訴機器學習模型這些數據“是什麼”或“包含了什麼”。核心目的是為模型提供“標准答案”或“學習資料”,讓它能夠學會識別和理解數據中的特定模式。
數據集是一個集合,指的是為特定目的而收集、整理在一起的數據的總體。它是機器學習模型的“糧食”和“燃料”。數據標注和數據集的關系是過程與結果、部分與整體的關系,二者密不可分。簡而言之,通過“數據標注”這個過程,將“原始數據”加工成有價值的“數據集”,從而喂養和訓練出智能的AI模型。沒有標注,數據就只是無意義的比特流﹔沒有數據,標注也就失去了對象。二者共同構成了AI發展的基石。(記者周雨整理)
分享讓更多人看到
本網專稿
- 重慶首個行政處罰公示信息信用修復應用上線
- 人民網重慶9月28日電 (陳琦、劉敏)為解決企業主體在行政處罰公示信息信用修復時“多頭跑、程序繁、周期長”問題,重慶市交通部門聯合市發改部門共同打造“交通運輸領域行政處罰公示信息信用修復一件事”應用場景。據悉,該應用場景於9月30日上線運行,將讓信用修復辦件時長由以往10個工作日壓縮至最短2個工作日。…
- 評論
- 關注