Choice数据负责人浦杰:Choice数据与金融科技
在深圳证券交易所指导下,由中南财经政法大学、东方财富、东财基金联合主办的“产学研用深度融合金融科技高质量发展”研讨会暨第二届全国ETF模拟投资菁英挑战赛启动仪式于8月11日在武汉举行。
(资料图片)
Choice数据负责人浦杰进行了《Choice数据与金融科技》的主题演讲。浦杰表示,Choice数据是以大数据治理和数据算法为核心的一家科技公司,通过多款应用产品为用户提供解决方案,比如智能研报,智能搜索,Choice 金融终端,数据库等等。公司在数据和算力上有先天的优势,能够覆盖全资产,全周期和全生态,包括社区数据和公开市场的金融数据。
(图为Choice数据负责人浦杰)
以下为浦杰致辞速记:
浦杰:首先,我今天主要说大概三个点。
第一部分,Choice是什么?Choice是以大数据治理和数据算法为核心的一家科技公司,通过多款应用产品为用户提供解决方案,比如智能研报,智能搜索,Choice 金融终端,Choice数据库等等。公司在数据和算力上有先天的优势,能够覆盖全资产,全周期和全生态,包括社区数据和公开市场的金融数据。我们会敏锐挖掘市场需求和机会,提供更适合金融行业的解决方案。
接下来,第二部分,我们通过从供应商的角度来思考金融和AI之间的关系。金融行业和AI结合如何落地一些应用,最后怎么把应用服务到客户,它的场景是什么样子围绕这些方面做个探讨,把今天上下午各位专家老师的问题,我也一并思考解答一下。
现在显示的这张图华为朱总拿出来过,他说2025年有10倍的空间,我们说得粗暴一点也就是说我们这家公司有10倍的空间,当然这是个线性的外推假设。实际上我这边要讲这张图的原因是跟后面这张做印证,我们发现很奇妙的事情,金融和AI对于整个行业的影响,它是会有一些明显区别的,把区别结合来看可以比较出来。这张图是gartner在2022年第三季度、四季度的时候出的数据,这个曲线的顶峰表示已经比较成熟了,曲线往下走用户量各方面的发展往下走,往上走说明这个技术场景方兴未艾。
合成数据,复合人工智能,决策智能这三个场景是他们认为2023年有一定的机会,我们总结下,这里几个热门应用都是在快速上升期,同时它符合多种AI技术的复杂融合。比如第一种合成数据主要是解决应对数据的训练集比较少,如何解决训练集的问题,它是什么逻辑呢?当我发现企业的训练集数据比较少的时候我怎么解决这个场景?解决的方法有几种,比如说我要做一辆车的训练模型,最好的办法把中国的13亿人训练一遍,但是实际上是不可能的,合成数据的应用是把所有的颜色用户形态、体重、身高、座位舒适度进行模拟,最后把这个数据集进行模拟训练,来提高模型的容错率,大概是这样的意思。
下一张图是gartner2022年四季度发布的金融AI这个技术发展情况,和传统的金融技术区别在哪里。我们可以看到这个图最大的问题在哪,他们推荐了四种技术,但是有三个技术都在成长的顶峰,甚至是已经开始衰落了,为什么?他们都是监督模型,金融行业较多还是监督模型,而我们知道现在的大行其道的模型基本上是强化学习模型和半监督模型。为什么金融行业到现在的应用相对以稳健和保守的,这个原因是什么呢?这是我们作为厂商思考的问题,我们会有一些结论思考和应用。
比如说第一个问题是刚才说的训练集的问题,大家都知道我在一家金融机构里面管理拥护用户的信息是非常关键的,我举个例子比如我要智能化有个系统叫CRM系统,去管理我的机构客户,有可能这个系统一个月只有小几十个活跃数,这个系统创建它训练它呢?同时,数据必须离线,不能上云,必须在公司内部使用,这就是很大的问题。
其次,金融行业要关注专业性、准确性和合规性的问题,什么是专业性问题呢?我说出去的这句话到底怎么样让客户觉得更专业,如何用AI的技术,我们这边是还在思考的。准确性也是一个问题,怎么解决大模型所谓的胡编乱造的问题呢?大家也很担心这个问题。最后合规性的问题,我们可以让大模型说一段话,怎么让这个观点变得可以发布给客户。是不是每次模型生成的内容先让人过一遍,改完再发出来。
这里我们经过调研以后,我们跟客户一起去交流发现的在这几种使用场景上,其实上午下午的各位专家老师也是提过这个点了,我们把这几个点的应用列出来了,通过驾驶员的角度,AI号称副驾驶,我们经过应用产品的落地以后其实有一些是经过训练以后可以变成类似主驾驶的,当然有些甚至连副驾驶都不是,大部分还是作为提供一些重复劳动,基于对以上这些点的应用的思考,我们有了新的技术框架,我们基于基础供应商,比如说华为、阿里,他们提供云服务,我们在上面构建大模型,在上面还会用数据+综合服务+小的业务规则模型去做二次的加工和梳理,最后形成现在的应用和用户需求,我们是基于这样的模型设计我们的产品。
以上,是我们对AI和金融的想法和理解,我觉得金融行业模型产品比较特殊。接下来赋能金融科技我们做了什么东西,我们其实是通过数据和算力助力算法模型全面发力数字化和智能化,因为我们主要是以数据治理和数据算法为核心的一家科技公司,所以我们其实在数据和算力上面有比较先天的优势,包括海量数据库以及各种文本性质的数据解析都是能够支持的,数据的内容方面我们其实能覆盖全资产全周期和全生态的,包括左侧社区内容数据和右侧的公开市场的金融数据,包括全球指数,资金流向,财报行情都是基础数据的供应商。
其次是我们现在可以做到的是除了当中文本类有一部分需要人工加上机器辅助做双重的审核识别去做数据加工以外,其他的各种类型的数据接入几乎全都是通过智能化的手段接入数据的,我们可以在几分钟以内发布所有数据的指标和内容。这是我们发布的数据量,主要是提供一个指标,基于全自动的AI识别的发布体系,基本可以保证一到两分钟发布一个指标。这是算力的情况。
接下来我们说一下对于我们思考的这些问题我们怎么去做这些数字化和智能化的实践,我们其实主要应用方向是三个,文本识别、摘要生成和文本及图的搜索,但是我们要保证这个东西的合规性,所以我们多讲一下应用的东西。首先我们实现了智能化标签应用,我们怎么快速抽取用户的标签,比如说我们选择一个类型的上市公司的公告或者研究报告,我们会把一个类型的上市公司研究报告里面关于这家公司的生产线,关于这家公司的盈利状况,关于人事变动的信息做归集合并,最后形成一张表,甚至会告诉客户你想知道差异的点在哪里,他们之间相同的点在哪里,他会进一步告诉你什么样的东西是对的,什么样的东西是不一样的,有哪些人讲的东西一样,不同点在哪里,这都可以通过追问解答这个问题。这个产品的一期解决了相同点和不同点,二期计划三季度会上线会把追问的功能加上去,实现了在相同点的情况下追问过去一个月的情况怎么样,过去三个月的情况怎么样,甚至为什么他们这么说,这些问题都可以追问,我们三季度会落地这个产品。
我们几乎把所有的研究报告拆开了,比如说这个报告里面有一份图,我就会把图拆出来,如果有数据来源就把数据来源拆出来,甚至我们会拆作者观点,比如说里面会有一句话说我们认为这个东西是这样子的,我们认为这个东西不是这样子的,我会把这个数据抽出来总结出一份作者可能是自己认为的观点的报告写出来,去赋能到前面的产品问答里面去。
接下来是舆情产品,这是新闻资讯的聚拢产品,主要是提供全网舆情的搜索功能,你可以定制法人机构、金融机构甚至上市公司和非上市公司2.5亿家左右企业的信息。
这个产品是最近的产品。我们写论文写研究报告如何做智能质量检查?在组件里面生成了一个产品,这个产品是我们会智能化地搜索这个图表和底稿数据里面有没有映射关系,如果没有映射关系会变成黄色的感叹号,如果有映射关系就会变色绿色的勾。如果产量增加5%,营业收入增加5%,你发现营业收入在5%底稿里面任何逻辑支撑不了5%,要请你解释一下这5%,否则就会被打回。接下来我们希望将这个产品继续打磨推广为论文的撰写、框架撰写的产品,辅助各位老师一起帮助做论文质检。
接下来下一步,可能在明年年初会把垂类的质控模型引入到逻辑梳理里面去,这样的话包括写论文的逻辑可以通过大模型理出来,把这个内容做得更完善,把这个信息做得更透明,这是我们的科技能力,这是我们对监管科技的赋能。
标签:
相关阅读
-
08-11
-
08-11
-
08-11
-
08-11
-
08-11
-
08-11
推荐阅读
-
Choice数据负责人浦杰:Choice数据与金融科技
在深圳证券交易所指导下,由中南财经政法大学、东方财富、东财基金联合更多
2023-08-11 19:25:32
-
欧元兑美元继续在下方支撑线上获得支撑
欧元兑美元继续在下方支撑线上获得支撑更多
2023-08-11 18:55:12
-
浙江:数智赋能全电航运 促进港口绿色低碳转型
8月10日,浙江省全电航运数智运营中心在湖州成立,标志着浙江省岸电建更多
2023-08-11 18:35:23
-
“焰遇”石林与火共舞 尽享阿诗玛故乡文化魅力
经过几天的阵雨,云南石林风景区空气清新凉爽,满目苍翠,游客接踵而至更多
2023-08-11 18:07:49
-
原油价格在上涨趋势中,短线面临阻碍
原油价格在上涨趋势中,短线面临阻碍更多
2023-08-11 17:47:02
-
美元兑日元延续上行趋势,接近上方阻力短期谨慎看
美元兑日元延续上行趋势,接近上方阻力短期谨慎看涨更多
2023-08-11 17:52:54
-
长沙何时放开限售?回应:住建局将会同相关部门认
长沙何时放开限售?回应:住建局将会同相关部门认真研讨:格隆汇8月11更多
2023-08-11 17:48:26
-
两盘明启认购,逾700套房源面市!
根据网上房地产官方消息显示,8月12日起两盘开启认购,分别是位于浦东更多
2023-08-11 17:22:24
时尚热图
热门标签
精彩放送
-
08-11
-
08-11
-
08-11
-
08-11
-
08-11
-
08-11
-
08-11
-
08-11
-
08-11
-
08-11
-
08-11
-
08-11
-
08-11
-
08-11
-
08-11
-
08-11
-
08-11
-
08-11
-
08-11
-
08-11
-
08-11
-
08-11
-
08-11
-
08-11
-
08-11
-
08-11
-
08-11
-
08-11
-
08-11
-
今日必看
-
精彩话题
-
今日推送
- 广州7月一手环比同比均现两位数跌幅 二手成交已连降4月 可能成为最先出台具体优化政策的一线城市?
- 重拳出击!国家安全机关破获美国中央情报局间谍案
- 东吴证券:给予唯捷创芯买入评级
- 民生证券:给予招商蛇口买入评级
- 图解成都路桥中报:第二季度单季净利润同比增100.96%
- 国泰君安:火电行业进入到盈利周期与扩表周期共振阶段
- “玲龙一号”全球首堆核心模块成功吊装
- 东方财富财经早餐 8月11日周五
- 无子番茄和无籽西瓜都用了生长素 无子番茄和无籽西瓜
- 8月11日重点数据和大事件前瞻
- 多部门会商部署重点地区防汛防台风工作
- 甘肃省首届和美乡村篮球大赛(村BA)圆满落幕
- 重磅!2万亿ETF市场迎来大利好
- 华大智造最新公告:上半年净利亏损9802.7万元 同比转亏
- 上交所拟完善交易制度:加仓主板股票可1股起买 ETF引入盘后固定价格交易
- 美国7月CPI低于预期 美股走高、热门中概股普涨
- 美亚柏科:截至 2023 年 8 月 10 日收盘,公司股东总户数为 54,503 户
- 农尚环境(300536)股东海南芯联微科技有限公司质押700万股,占总股本2.39%
- 合资开始做减法?电马降价+官号关停,长安福特全面接手
- 冀中能源(000937)股东冀中能源邯郸矿业集团有限公司质押735.76万股,占总股本0.21%
- 成都路桥最新公告:上半年净利润465.8万元 同比扭亏
- 升空一周年,天上的“河南星”都干了啥?
- 甘咨询最新公告:中标甘滩寺水库水资源高效利用工程勘察设计项目
- 8月10日华立科技发布公告,其股东减持231.47万股
- 中一科技:截至2023年7月31日,公司股东总户数14,770户
- 8月10日赛摩智能发布公告,其股东减持485.2万股
- 碧桂园:预期上半年净亏损450亿元至550亿元
- 开源证券:给予欧普泰买入评级
- 美国7月CPI不及预期,现货黄金短线跳涨逾8美元
- 【金色热线】云南电信:多向发力打击电信诈骗
- 复星医药:二级市场的股价受多种因素的影响,对此,公司保持审慎关注
- 8月10日晚间沪深上市公司重大事项公告最新快递
- 兆丰股份:公司目前尚未涉足线控底盘技术
- 图解德石股份中报:第二季度单季净利润同比减15.98%
- 指南针:公司的主要业务包括金融信息服务业务、证券业务和广告服务业务
- 得润电子:公司目前暂未涉及光纤连接器产品业务
- 今日早参
- 康强电子:核电方面在公司2022年年度报告“第三节 管理层讨论与分析 研发投入 ”有详细介绍
- 华金证券:给予国瓷材料增持评级
- 保利发展:公司于2023年6月完成10派4.5元利润分配方案,合计分红近54亿元
- 冀东水泥:公司未开展水泥及水泥熟料出口业务
- 舒泰神:相关产品已上市,具体购买建议您可电话咨询010-67519898
- 抢锂大战第二日:马尔康加达锂矿勘探权竞拍加入 出价已到25.5亿元
- 8月10日龙虎榜:1.75亿抢筹招商南油 机构净买入9只股
- 三高人群能买重疾险吗?条件是什么?
- “铁拳”行动 | 丝桐服装、滔博鞋业被点名 福建公布2023年第四批典型案例
- 产品质量不合格 上海永久被处罚
- 市场监管半年谈|安徽:全力维护公平竞争市场环境
- 福建福州:强力推进养老诈骗违法整治行动
- 璀璨夺目!盘点闪耀大运会舞台的文化明珠