为促进数据要素安全合规高效流通、赋能人工智能大模型创新发展,作为2023世界人工智能大会的重要组成部分,由上海数据交易所、大数据流通与交易技术国家工程实验室承办的“大模型时代下的数据要素流通”主题论坛今日在上海世博中心举行。
(资料图片)
上海市经信委信息化推进处处长钱晓在致辞中表示,上海作为国家大数据综合示范区,始终致力于推动数据产业发展、数据要素市场培育、数字经济红利释放,2022年全市数据核心企业突破1200家,核心产业规模近3400亿元;建设了上海数据交易所,累计挂牌数据产品超1300个,率先提出数商体系,数商新业态蓬勃兴起,全国首个数据要素产业集聚区在张江启动建设。
钱晓指出,未来,将继续加强技术创新,形成行业领先的高质量语料标准操作流程和技术规范;完善组织机制,形成包括图书馆、媒体、互联网平台、大数据企业等在内的核心数据伙伴群;做好评估机制,加快构建高质量数据集的评价指标体系。
启动语料数据生态建设
语料库建设是一件长期性、专业性的工作,需要遵循相应的质量标准和规范,并保持持续更新和扩充,以适应大模型发展的新需求和新挑战。上海数交所作为全国数据要素市场核心枢纽,在助力大模型语料库建设上具有天然的优势。上海数交所官网已经于7月7日正式上线语料库,累计挂牌近30个语料数据产品,包含文本、音频、图像等多模态,覆盖金融、交通运输和医疗等领域。
为更好打造高质量语料库、围绕语料数据共建数商生态,上海数交所牵头发起语料数据生态创新合作伙伴计划,携手首批合作伙伴上海人工智能实验室、商汤科技、中国知网、澜舟科技、OpenKG、拓尔思、新致和蜜度正式启动该计划,积极引导不同行业、不同领域、具有一定规模的高质量语料数据产品挂牌交易,推动人工智能大模型技术创新与应用落地,进一步丰富语料库多样性,助力数据要素市场建设。
上海数交所总经理汤奇峰表示,大模型建设中,语料库是一个非常重要的方向,语料库采购已经在不少大模型企业成本中占据重要比重,上海数交所希望以市场配置的方式组织数据要素推动语料库建设。上海数交所建设语料库主要考虑两个维度:一个是语料库的质量,另一个是语料库的开放程度。
“比如有的企业具有海量高质量数据资源,开放意愿度也很高,但需要组织大量社会第三方企业帮助组织相关的大模型训练,我们针对四类数据产品开发情况不同、实际需求不同的供方企业制定了差异化工作策略,着力打造语料数据生态。”汤奇峰指出。
数据要素价值不断凸显
数据要素在人工智能大模型的发展中具有关键性的作用,决定了模型的训练质量、性能表现和应用领域的广度与深度。
中国电子副总经理陆志鹏认为,大模型技术实现高质量发展,数据有效供给是关键,亟需建设安全可信的数据底座。当前数据合规确权、计量估价、协调分配、安全隐私保护等核心难题需要破解。
大数据流通与交易技术国家工程实验室常务副主任黄丽华表示,数据驱动三大变革,包括经济结构、创新范式、企业模式。面向大模型,数据要素市场大有可为,多层次数据要素市场的建设将提供重要助力。
“多层次数据要素市场的建设需要有明确的数据需求应用场景,数据要素产权制度可以提供重要支撑,合规安全机制提供保障,基于这样的一个市场,数据产品低成本、大规模可得才有可能实现,才能更好地赋能商业高效应用,促进数字化转型。未来,颠覆性创新一定是基于数据+人工智能+行业专业知识发生的。”黄丽华指出。
中国知网(CNKI)副总经理张宏伟表示,数据是人工智能的基石,数据的质量和数量最终决定人工智能水平高低,影响其安全性、可信性。知网拥有海量高质量文本语料数据,打造可融入行业生产系统的专业知识增强大模型,同时基于CNKI知识增强大模型,将全面升级现有产品服务,推出AIGC检测等新服务,赋能知识密集型行业领域。
共建生态共推大模型应用落地
2022年11月,OpenAI推出对话式通用人工智能大模型ChatGPT,全球新一轮AI创新热潮随之掀起,国内多个人工智能大模型相继推出并快速迭代,比如商汤科技“日日新sensenova”大模型体系、科大讯飞“讯飞星火认知”大模型、澜舟科技“孟子MChat”大模型、蜜度“蜜巢”系列模型、拓尔思“拓天”大模型。
商汤科技联合创始人杨帆认为,大模型在C端、G端、B端都有大量应用场景,赋能医疗、金融、科研、制造等各行各业,将带来全新的技术迭代和场景升级,AI产业即将迎来一个更加繁荣的“大航海时代”,数据将成为智能化过程中最重要的要素,包括数据获取、数据标注与存储、数据处理与清洗、数据管理等环节都将影响人工智能的水平。
科大讯飞于今年5月正式发布星火认知大模型及应用成果,向教育、办公、汽车等多行业延伸覆盖。科大讯飞大数据研究院院长谭昶表示,认知大模型推动了通用人工智能技术阶跃,为更好解决数据更新、数据偏见和数据安全等问题,各方需要加强合作共建生态,共同推动大模型应用落地。
拓尔思总裁创始人施水才认为,高质量数据才是大模型价值跃迁的制胜法宝,此外,基础大模型没有办法解决行业专用问题,行业大模型是行业应用落地重点。今年6月底,拓尔思正式发布“拓天大模型”,并率先面向媒体、金融、政务领域推出了行业大模型,未来一年还将陆续推出网络舆情、公安、知识产权、法律、审计等行业大模型。
关键词:
为促进数据要素安全合规高效流通、赋能人工智能大模型创新发展,作2023-07-08
本文编辑剧透社:issac未经授权严禁转载,发现抄袭者将进行全网投诉现2023-07-08
Policeofficerswearinganti-mosquitoclothingwerespottedsprayinginsectrepe2023-07-08
7月8日,由上海闪马智能科技有限公司(下称“闪马智能”)、上海嘉丰车2023-07-08
中国哈尔滨获得2025年第九届亚冬会举办权亚奥理事会8日在泰国曼谷举行2023-07-08
现代快报网是由凤凰出版传媒集团旗下的现代快报倾力打造的江苏新闻门户2023-07-08
以好朋友聚会为主题的综艺《是好朋友的周末》这一周迎来了德云社。先导2023-07-08
新华社南京7月8日电题:江苏无锡:“水蜜桃之乡”有了“科技味”新华社2023-07-08
什么是蓝屏重启蓝屏重启是指在使用Mac虚拟机时,出现了蓝屏并自动重启2023-07-08
2023年7月7日星期五农历癸卯年·五月二十2023中国之治《旌表孝子李得成2023-07-08
1、整夜例句:Wesatupallnightchinningaboutcollegedays 我们整夜长聊2023-07-08
仰望U8(图片)是比亚迪旗下的高端品牌仰望的首款量产车型,定位为一款硬2023-07-08
抄写作文网小编为大家提供汪广洋有哪些古诗赞美父子情深的诗句来供大家2023-07-08
本报北京7月7日电(李心萍、安亦涵)今年以来,机械工业运行总体延续向2023-07-08
北京:无人驾驶的出租车将正式上路2023-07-08
安全管理是工程建设中不可或缺的一项重要工作。安全与危险相互对立,也2023-07-08
“警察同志,有人要轻生!”6日凌晨4时许,哈尔滨市防洪纪念塔街面警务2023-07-08
火箭官方宣布,球队正式签下老将杰夫-格林。而据此前报道,杰夫-格林的2023-07-08
为进一步弘扬中华民族扶弱助残的传统美德,给予残疾人更多关爱和帮助,2023-07-07
TOP1 心跳回忆制作出品:宇峻科技游戏介绍:在光辉高校,一直流传着一2023-07-07
挖贝网7月6日,张家界(000430)董事会于近日收到董事长刘少龙、董事刘2023-07-07
安托万-沃克:我会考虑用布朗换利拉德后者+塔图姆将震动东部,利拉德,热2023-07-07
读创 深圳商报首席记者包力通讯员苏新华张华 文邹成耀 图记者近日获悉2023-07-07
2023年7月6日,由北京中指信息技术研究院主办,中国房地产指数系统、中2023-07-07
1、东莞市心网网站建设公司是一家提供网站建设、网站改版、网站策划、2023-07-07