什么是真正的大数据?
大数据已经火了几年了,说大数据的人也越来越多,尤其是人工智能再度崛起,且现在的人工智能与大数据密不可分,所以可以预见大数据会继续火下去。但仍然有很多人没有搞清楚到底什么是大数据,仍然有很多人在把小数据当大数据,有意、无意鱼目混珠的人依然太多。
大数据不是指很多很多数据。
所以不是存储了很多数据就是在搞大数据了,因为“大数据”只是个简称,说全一点应是“大数据挖掘”,没经过挖掘的大数据只是没有开采出来的原油,一点用处都没有。
大数据也不是指一般意义上的数据挖掘。
有很多人以前是搞数据分析或数据挖掘的,当《大数据时代》这本书一问世、大数据开始火的时候,他们摇身一变就成了搞大数据的专家了。如果真是这样,就根本没必要提大数据这事儿,因为它本来就一直存在着,只不过换个说法。就好像我们没必要今天突然提出个说法“饮H2O”来代替“喝水”。嗯,对,那叫玩概念。
“大数据挖掘”其实还没有说全,再说完整点,应该是“大数据自动挖掘”,这是一种全新的数据分析方式。
以前的数据分析或挖掘,是指人通过数据去进行分析,挖掘出一些规律性的东西以供以后使用。当数据较多时,往往采用抽样分析,所以这种方法相对应就叫小数据。
但面对大量数据,由于不光是数据量太大,而且往往包括数据的维度也很多,数据产生的速度也非常快,比如淘宝双十一,每秒钟都在产生巨量的数据。人已不可能去处理这样海量的数据,甚至是如何处理都不知道,这时必须用电脑来自动处理,挖掘出数据中的规律。
但是目前电脑还不能像人那样进行严密、复杂的逻辑思维,因此它们也无法用我们人的思维模式去分析数据,人可能只要较少的数据就能分析出其中的规律,数据多了反而没有办法,所以我们人类都是采用抽样分析。
电脑则正好相反,无法根据少量数据去分析出规律,但它有一个优势,那就是运算速度非常快,因此有可能处理海量数据以后找出其中的规律。
由于电脑还不能进行复杂的逻辑思维,所以它的处理方法很简单,就是进行简单的统计运算,也就是“硬算”,统计出在什么情况会出什么样的结果,然后当类似的情况再出现时,它就会告诉我们可能会出现某种结果了。
由这里也可看大数据的另一个特点,即大数据主要是进行预测,告诉你未来将会出现什么样的结果。而不是只分析出过去的走势和现状,未来还是要由人去判断。
为什么这种简单的方法会有效呢?这就回到“大数据”这个词上来了,那就是因为数据量非常大,统计出来的结果就往往是正确的。
大家一定都知道这个例子,扔硬币来统计正、反面出现的机率,如果只扔10次,也许正面出现9次,以此来得出结论肯定是错的;但如果你扔10万次、100万次,甚至更多,那你统计出来的结果基本是正确的,正、反面出现的机率一定是各50%。
是的,大数据自动挖掘就是依据这一原理。
这里没有严密的因果分析,不是通过数据分析出原因再推导出结果;而是通过统计知道有这样的情况,一般就会有这样的结果,也即现象与结果的相关性。所以大数据就有一个显著的特点,只关心相关性,不关心因果;用更通俗的话说就是“只知道结果,不知道原因”。
这实际是人们根据电脑的优势,找出了一个全新的数据分析、挖掘方式,与传统的方式完全不同,所以传统那些搞数据分析或挖掘的专家并不能称作为搞大数据的。
不过你一定要小心,冷不防你就会碰上一个这样的专家,他们甚至可能是来自某名牌大学的知名教授之类。进到书店你也会看到许多讲大数据的书,封面无一例外都有很大的“大数据”三个字,但其实都是在讲传统、人工的数据分析方式,和大数据一点边都不沾。当然,这里不包括《大数据时代》这本书。
很多反对大数据的人也主要是反对“只关注相关,不关注因果”这个特点,他们最喜欢举的例子就是类似这样:你上午打了个喷嚏,下午某个股票就涨了,根据相关性,所以你的喷嚏能预测股票上涨,这岂不很荒谬?
举这种例子的人完全忘了“大数据”三个字,上面说了,大数据的相关性是基于大量数据的统计,所以才是可信。而你打喷嚏与某股票上涨这种巧合会出现很多次吗?换句话说,如果这种巧合真的出现了很多次,比如说你统计了一百次你上午打喷嚏,下午某个股票就上涨,那我问你第101次你上午打喷嚏,下午你买不买这支股票?估计傻子才不买。所以我们说即使从因果关系看这种相关性是荒谬的,但依此指导行动也是靠谱的。
大数据就是让电脑根据一些简单却巧妙的算法,去进行大量数据的统计,找出事物之间的相互关系,甚至是连人都想不到的规律。大数据在这里基本是与业务逻辑无关的,人不需要知道这是什么业务,比如分析移动互联网行业的数据,他不需要知道这个行业的来龙去脉、当前状况等,他只需要对大量历史数据进行统计,就能够找出其未来的走势。
下面讲个小故事:
80年代有俩计算机呆子在IBM做翻译系统。当时的砖家都在探索语言之间的内在联系,语法、句法神马的。俩呆子路数不同,他们把能找到的各种语言相对应的文献全部做成数据,统计类似句子以前是怎么翻译的,以后就照葫芦画瓢。旁人批评“这种计算机蛮力不算科学”,后来他俩被一个对冲基金老板招走了,成为复兴科技co-CEO,老板是JimSimons。
复兴科技co-CEO每位年收入大概是1亿美元,比华尔街各大行CEO的年收入要高一些,关键是这两位几乎名不见经传。他们老板JamesSimons比较有名,是位数学家,跟陈省身一起写过定理,跟杨振宁是同事,年收入超过10亿美元,现在退休做慈善。清华有Chern-Simons楼,是杨振宁拉Simons掏钱修的。
在金融投资领域,只关注相关性、不关注因果的对冲基金做得很好(复兴科技,DEShaw),但金融理论基础深厚、大数据分析能力欠佳的公司却没有类似的业绩,MIT金融学家罗闻全坦言不明白复兴科技在干什么。
也许有人说了,语言和数字是两个完全不同的领域嘛。这就叫业务逻辑无关性。用大数据的思路,你别管原因,那两个复兴科技的呆子已经告诉你结果了,这样做是完全行得通的。
其实对于电脑来说,一切都是数据,并不是1、2、3、4才是数据,专业这叫数字,也就是说数字、文字、图片、声音、视频、程序等等,只要能存在电脑硬盘里的都是数据。大数据不管你是什么样的数据,都是一视同仁,即找出相关性。
你现在知道什么是真正的“大数据”了吧。首先记得大数据是用来进行预测的,即直接告诉你未来的结果,另外就是牢牢记住7个字“大数据自动挖掘”,那就谁也忽悠不了你了。
什么是数据公司?
大数据公司通常是指有获取大数据能力的公司。
这类公司可以完整地实现大数据的采集、分析、处理,为各大企业提供高端信息技术咨询服务,还可通过构建一个数据资产分享和交易平台把数据或信息作为资产直接进行销售,面向个人提供基于数据分析结果的服务。
物流界科技公司谁最黑?前三还有一个是“黑户”
第1256期
UPS说:我们是算法驱动。
仿佛忽然间,物流行业达成了一个共识:牛逼的物流公司一定是一家科技公司。
出品 | 运联传媒(ID:tucmedia)
撰文|贾艺超(运联传媒记者)
编辑|小L
百世和菜鸟,当时几乎都是因“科技”而生。顺丰、韵达、圆通、中通等快递公司,近年来也纷纷提出“科技引领”的口号,立志“成为一家以科技驱动发展的企业”。
今年5月,安能宣布未来3年将投入20亿用于“物流+科技”战略布局,并与3家科技公司达成战略合作协议。在这3家科技公司里出现了一张行业新面孔:奇弦智能。
各行各业都在说“黑科技”,而“奇弦智能”就“黑得一塌糊涂”,简直是物流界的“一股黑流”。他们到底“黑”在哪里?
一家“很黑的”公司
奇弦智能2016年3月才成立,创业第7个月就完成估值5亿的第二轮融资,在互联网日趋透明的大背景下,竟是一个搜不到任何消息的“黑户”!
☉第一黑,无“知”,没有感知。
在不到一年半的时间里,奇弦智能“悄悄地”与“三通一达”、百世、顺丰、京东、EMS、德邦、安能这10家大企业中的7家建立了合作关系。
在网上搜索有关“奇弦”的新闻,仅找到一篇,还是招聘新闻。从这篇新闻中才发现,原来他们已经悄悄完成了2轮融资。经调查,奇弦智能的估值已翻了五倍,且投资方都是科技背景的公司。
☉ 第二黑,小天才扎堆“搞事”。
奇弦有80%的员工都是国家和各省的理科状元级别怪才,其中有40%没有参加过高考,均因获得全国计算机竞赛一等奖而保送名牌大学;还有40%是理科竞赛二等奖、三等奖及省内一等奖。
是什么样的“黑”技术需要凝聚如此多的“小天才”才能去应付?在他们的招聘要求里,唯一的一个标准就是:“不要拉低奇弦智能的平均智商。”
这么一帮小天才聚在一起究竟是在搞什么事儿?
顺丰、“三通一达”等公司拥有的IT和科技人才规模如今都已成百上千,不乏各种博士和奇能异士,难道就没有一家能搞出这一“黑”技术?如此高价值的“事”,为何因“为科技而生”的菜鸟和百世都不去搞呢?
☉ 第三黑,神秘技术。
奇弦智能的“黑”技术谁也不知道。它既不是大数据,也不是人工智能,还不是运筹优化和仿真,搞了个“组织全息计算”。谁也不知道这是个什么东东。
“组织全息计算”听上去很牛逼,号称“要把一个商业组织的运行装到计算机中去”。
但从常理上来讲,想想都不太可能。企业在不断变化,你怎么把运营的全部要素和变化实时映射到计算机里面去?这么大的计算量,如何做计算?我们讲运筹学,几十个变量就已经很难了,当你把成千上万了变量装进去,如何协同计算和优化?
算法决定物流下一轮竞争的成败
虽然没能完全看明白奇弦智能这家“黑”科技公司到底在干什么,但有一点肯定的是他们在搞和算法相关的东西。而且这么多大型物流公司和同一家科技公司深度合作,这是不是代表了某个技术趋势呢?
☉ 科技焦虑症
物流科技其实不是一个新热门词,在一轮又一轮的行业变革中都起到了举足轻重的作用。从最早的企业内部信息系统ERP,到TMS、WMS,到移动互联网时代的APP、O2O,再到当下大热的无人机、大数据、人工智能等,行业围绕着信息化、数字化、移动化、可视化、智能化方向一路交织向前发展。
在每一次新科技进入物流领域的时候,物流公司都像得了焦虑症一样争先恐后冲进去,生怕自己被同行赶超,生怕自己没在科技前沿,生怕自己错过颠覆行业的机会。
前几年物流行业蓬勃发展,很多公司靠着跑马圈地跑在了行业前列。如今行业竞争升级,从对垄断资源的竞争转向开放市场的竞争,从粗放式的规模竞争转向精细化的服务竞争,众多物流公司已经强烈的意识到需要用科技的手段来提升自己的竞争力。但到底是用什么样技术呢?
☉ 无人机等决定颜值,当下算法决定成败
要回答这个问题,还要看物流公司想解决什么样的问题。绝大部分物流公司每天都会面临这样的决策问题,比如该如何给车辆排班才能以更低的成本提供比竞争对手时效更好的服务,该如何为服务合理定价,该如何制定库存策略在成本不变的情况下提高产品送达实效,如何降低人工成本提高工作效率,拓展市场时分拨中心应该设在哪里、需要多大场地。诸如此类问题会直接影响物流公司的市场份额和盈利能力,关乎企业中短期的竞争胜败甚至是生死存亡。
在上一轮竞争中,物流公司之间靠信息化、数字化拉开了竞争差距。下一轮竞争会更为激烈,只有靠算法才能进一步把物流应有的规模效应、网络效应、协同效应充分发挥出来。
如此多的快递快运公司和奇弦智能的深度合作已经充分能看出,与无人机那些在短期内只能增加颜值的技术相比,运用算法来协助科学决策、促进业务协同、效率提升、成本节约、快速迭代才是解决物流公司目前燃眉之急的有效技术手段。算法是下一轮行业竞争的核心。
☉ 算法技术稀缺
算法有别于企业信息化,诸如TMS等信息化工具帮助物流企业固化业务流程、加快信息传递,是相对成熟的技术,有大量的软件企业能提供较为成熟的产品。算法是个稀缺技术,国内外懂算法的人才不多,懂物流领域算法的更少,能将算法通过先进的计算机技术成功运用到企业的全世界都屈指可数。
国外大型物流公司已经受益于算法了,Fedex在孟菲斯的超级枢纽智能调度靠算法,马士基运用复杂的算法动态调整各项收费,UPS直接称自己是一家算法公司。有人问,是不是可以直接把国外现成的技术拿来用呢?
答案或许是否定的,一来是行业环境不同,想想多少国外成熟的企业信息系统到了中国就水土不服了;二来是国外现有的技术能处理国内物流行业如此复杂多变的问题吗?
今天中国的物流行业不像欧美那么成熟,而是处在高速发展、快速迭代、不断整合的过程中。我们的“物流”特别“妖”,在中国土壤上产生的物流自带属性,你很难降住它,因为有太多的变量在背后“捣鬼”。
奇弦智能要降中国物流的“妖”
☉奇弦智能的核心技术是运筹与优化吗?
不是。因为运筹没办法应对那么多的变量,不能解决高维变量带来的NP-hard(非确定性多项式问题non-deterministicpolynomial,缩写NP)和维数灾难。在奇弦智能看来,今天中国快递和物流公司所遇到的问题和挑战很特殊,很难“解耦”成过去几十年国际物流大公司所形成的标准化运筹问题来求解。试图将一个复杂计算问题“拆解”为成一个个相互独立的“积木”问题,然后逐个击破的方法,很难适合于中国情景,效果也非常有限。
☉奇弦智能的核心技术是模拟与仿真吗?
不是。仿真的核心是基于某个时间截面,针对公司的某个子系统,以“简单就是美”的原则去抽象和简化出一个模型,来对现实进行建模、模拟和分析。
今天中国的主流快递和物流公司,依然在“野蛮”生长,组织的核心部分都在实时发生着各种不可预料的变化,但传统仿真适合回答的问题,在如此多变的情境下其价值极其易逝。
☉ 奇弦智能的核心技术是大数据与深度学习吗?
也不是。因为今天的大数据公司,几乎无一不是借助统计分析、机器学习或深度学习等看似“酷炫”的科技手段,来学习和分析大数据背后蕴含的相关性规律。
但这个世界背后的最大的本质是“因果”,仅仅靠相关性规律的计算,难以捕捉现实中大量存在的非连续性变化。今天中国的快递和物流市场在生长,竞争不断,企业也在发生不连续的变化。传统大数据确实能在一些局部问题上获得突破,但无法实现整个组织的计算。
☉ 奇弦智能的核心技术是组织全息计算
通俗的讲,“组织全息计算”就是在计算机里面还原出一家公司,这家公司所有的要素都在里面,而且这些要素所构成的因果规律都在里面,可以实时地计算现实中所有的变化,并把它们都镜像到计算机里面。
奇弦智能运用自己研发的计算机平台,帮助物流公司快速将整个核心运营系统“原子”级别还原到计算机里,然后借助超级计算能力,进行实时的运算。
虽然奇弦是一家年轻的创业公司,但据说奇弦研发团队积累了10年的技术和算法已能帮助合作伙伴的中转场或转运中心效益提升高达30%,在保证时效不变的情况下全网车线成本降幅最高能达25%。最最重要的是,能让一家公司的核心运营系统优化试错迭代的速度提升至少10倍。
就这次讨论的算法而言,运联认为今天我们所说的算法,不是类似“车货匹配”平台的某个领域、某个应用这样的范畴,也不是类似“送货无人机”在某个场景下的某种工具。
算法可以用在物流多个领域的各个环节,协调多个参与方共同增效降本,产生协同效应。它对于物流行业的影响会类似于工业4.0,它是一种生产方式的升级,是对管理的赋能,是行业变革的加速器。
无论奇弦智能的黑科技未来何去何从,我们希望看到在中国会有更多物流科技公司的出现,依靠技术推动整个行业的进化和演化。
END
更多内容点击阅读
零担30强排行榜
实名制扑街 ▎物流黑话
跨境电商 ▎家居物流
网点卖货 ▎绿色物流
车效提升方法 ▎公铁联运 ▎供应链公司
*转载请注明作者及来自运联传媒
数据公司具体是做什么的?
大数据公司通常是指有获取大数据能力的公司。这类公司可以完整地实现大数据的采集、分析、处理,为各大企业提供高端信息技术咨询服务,还可通过构建一个数据资产分享和交易平台把数据或信息作为资产直接进行销售,面向个人提供基于数据分析结果的服务。
高精特成都大数据科技有限公来自司待遇怎么样
好。1、休假方面。高精特成都大数据科技有限公司国家法定节假日以及周末都休息,加班现象少。2、奖金方面,高精特成都大数据科技有限公司过年的奖金也是很高的。员工福利待遇很好,有五险一金,加班现象少,且加班也有加班费。
湖北博和来自利大数据科技有限公司是国企吗
湖北博和利大缺乱数据科技有限公司不是国企。根据相关资料显示,湖北博和利伏源档大数裂亮据科技有限公司,成立于2021年,位于湖北省武汉市,是一家以从事软件和信息技术服务业为主的企业。
从数据分析到大数据,如何不再是噱头?
谈到大数据,有人认为是传统数据分析的新噱头,它几乎变成了一个框,什么都可以往里面装;也有人说是一种创新,一次伟大的革命。那么,日志分析作为大数据应用的代表,与传统数据分析相比,有哪些变与不变?目前应用现状如何?国内外市场有哪些异同?
嘉宾:刘岂骥,北京互利科技产品负责人
主持人:严尔银,北京瑰柏科技有限公司产品合作总监
组织者:联动原素&《物联网与云计算》杂志
嘉宾介绍
刘岂骥,北京邮电大学本科,毕业后在中国移动设计院负责大数据产品,节能监控平台为多家三甲医院及智能楼宇应用;后负责广告投放系统,对接国内一线视频媒体,月pv达90亿,对于广告数据应用有充分理解。现为互利科技的产品负责人,其产品HOOLI涉及机器数据采集、处理及其复杂场景应用,致力于打造更聪明的数据分析平台。
主持人介绍
严尔银,北京瑰柏科技有限公司产品合作总监,目前主要负责公司移动健康管理服务平台项目的供应链管理及对外合作业务;包括智能穿戴硬件设备、健康管理服务、慢病管理服务等提供商的合作。传统电信零售行业转行移动互联网行业。
主要问题
严尔银:各位群友晚上好!感谢主办方联动i访谈的邀请和互利科技的刘总接受访谈交流,欢迎刘总。
刘岂骥:大家好,我是这次的分享嘉宾,很荣幸跟大家分享一些关于日志大数据相关的内容,希望大家不吝赐教。
严尔银:互利科技团队的产品是与大数据有关,下面我们跟刘总一起了解关于大数据的那些事。首先请刘总先介绍下贵司的成立背景以及团队构成?
刘岂骥:公司创始人林坦之前在亚马逊和谷歌工作,在Devops过程中发现了很多问题,一部分是开发运维过程固有的问题,一部分觉得这些事情绝对可以做得更好,另一方面确实国内在这一方面比较落后。现在国内外关于以日志为数据源的应用也是非常多的。我们从日志数据入手,做的是一般性的解决方案,给客户足够大的自由度建立仪表盘和告警等,能够cover住大多数日志数据需求。
目前我们团队绝大多数成员都是技术背景,能够很好的理解企业级需求。绝大多数毕业于顶尖大学,曾服务于亚马逊、HP等各类优秀企业,对于企业级产品服务具有深刻理解。我们公司叫做Hooli,名字取自美剧《硅谷》siliconvalley,我们的梦想是成为一家伟大的公司。
严尔银:刘总的开头介绍分成了解需求、组建团队、然后是为要从事的事业取一个有意义的名字。那么能详细介绍下贵司提供哪些产品与服务吗?
刘岂骥:我们的产品是实时日志分析平台,主要具有数据采集、日志搜索,仪表盘,告警和分组权限等功能。
其实任何一款数据分析产品都会包含三个部分,数据收集、核心处理、数据应用。HOOLI也是如此,目前我们支持的数据来源通过配置client端的agent发送,或者通过curl命令脚本发送,目前我们支持自动解析的日志包括Apache,nginx,Windows,log4j,MySQL,Hadoop等。
Hooli这边收集到日志做进行初步的数据清洗,对已支持自动解析的日志进行数据解析并建立索引,我们会对这些日志数据进行数学建模,同时还具有一定的机器学习算法。实时数据分析平台的挑战在于如何能够在保证实时性的前提下,尽可能多的提升分析维度。我们这边使用了一些开源框架和我们自己优化的服务来满足客户的需求。
在hooli数据中心的计算能力和速度能够保证的前提下,前端页面可以通过谷歌式搜索对目标日志进行精确筛选和定位,形成基础图表,多个相关的图表可以组成仪表盘。我们demo账号里面有一个供参考的某网站运营数据相关的统计,里面包含新增用户,活跃用户,用户地理分布等数据。简而言之,日志基本包含了所有业务相关的数据,而用户可以通过HOOLI这款产品将这些特征定制化的展现在仪表盘上。
另外一个功能就是告警功能,用户可以将筛选后的日志进行告警设置,告警是运维场景常用功能。
我们的服务是比较全面的:首先,售前会有一个时间足够充分的产品试用期;其次,对于要求私有部署的客户我们会协助整个部署的过程;作为专业的数据分析软件,我们还会提供定期的培训,帮助建立业务相关的仪表盘和告警等。不论SaaS部署还是私有部署我们还会根据客户反馈进行周期性产品更新。产品服务本身呢,我们会保持最高的稳定性。
这是我们的产品架构图,从数据采集到hooli数据中心进行结构化、建立索引等,之后进行相关的数据建模。在页面端形成各种图表应用。
这是我们的搜索页面,在这个页面用户可以对已经导入的日志进行查询、筛选、构造图表。
这是我们的仪表盘页面,用户可以将统一功能的指标图表放在同一仪表盘中。
这是HOOLI的告警页面,用户可以自定义告警,关注关键指标。
严尔银:从整个架构图中大家日常能看到的也是最顶层的各种图表应用,这种直观的图形后面是由很多数据清洗、归类、筛选得出的,庞大的数据网络[强]。
刘岂骥:对于日志上传,我们具有本地上传和流式上传两种,目前支持类型日志,包括Apache,nginx,linux,Windows,log4j,mysql等等。实际大家平常使用的图表后面是有很多处理过程的。
严尔银:请教一个问题,刘总,日志数据和日常大家口中说的大数据有什么区别吗?
刘岂骥:实际上,大数据是一个很宽泛的概念,而日志数据是大数据的一个子集。
严尔银:能否分享一些应用场景或成熟的应用案例?让我们直观的了解这个产品能为用户做什么?
刘岂骥:说一下我们最近在做的国内某运营商的日志分析解决方案吧。其实我们互联网公司最了解的是互联网公司,我们一般用开源框架搭一个服务,然后让尽可能多的用户去使用产品,最后达到一定规模的时候再去解决稳定性问题、或者进行业务优化。
我们一般互联网推崇的growthhacking也是紧密跟随多个指标来进行不断的优化与迭代。然而运营商作为一个业务模型成熟的传统企业确实不一样的,它更追求业务稳定性,之前我在运营商工作的时候,我们讲网络的可靠性指的都是电信运营商的可靠性,比如可靠性是5个9的系统,指的是99.999%,这背后实际上多级冗余,冷备份和热备份的功劳,买的硬件防火墙也通常是电信运营商级别的防火墙。可见运营商更加关注它的服务是不是真的可靠。同时运营商网络中可能存在的僵尸网络检测、异常流量监测、智能流量分析都是运营商的刚需,是影响运营商网络可靠性的。
有点扯远了,说回运营商的案例,运营商运维中心的监测软件实际自由度比较低,基本上能够满足ITOM的需求,而无法满足ITOA的需求,关于ITOA和ITOM我们可以一会儿详细说下。针对安全,僵尸网络、异常流量的监测,我们根据具体的日志特征建立告警。
Hooli的实时日志分析一方面定制化适配运营商各个模块的特有日志类型,另一方面满足客户对于业务监控和分析的需求。目前我们在帮助做的是灵活的花费详单以及其他的一些比较灵活的报表。
严尔银:刘总的例子举的很生动,产品的稳定性和用户使用的满意度是检验一个产品成功的其中一项指标之一。相比市场上的同类产品,贵司在产品、技术、商业模式方面做出了哪些创新?
刘岂骥:那这里我就要向大家介绍关于ITOA和ITOM的概念了。ITOM指的是IT运维管理,ITOA指的是IT运维分析,通俗点说,比如我有一个网吧,运维管理就是我家有多少台电脑,每台电脑什么配置,什么时候要更新电脑了,这是ITOM做的事情。而运维分析指的是大家用我的电脑究竟在干什么,有多少人在LOL,有谁可能在看些不健康内容,这个说的就是ITOA了。国内IT圈做ITOM有些年头了,而且也比较成熟,在运维方面国内甲方也更关注稳定和可靠,而国外已经开始使用日志数据在业务、运维和安全领域均有应用。
我们的团队带着硅谷的技术其实是有底气说我们能做到这些,能够帮助客户进行IT运维分析,找到业务提升点,保证服务的稳定性。
从产品上说,数据产品一直有个问题待解决,就是学习成本的问题,数据产品做得太专业,大家不会用,太简单的话,用户的背叛率就会很高,因为产品本身技术门槛就很低。
举个具体的例子,hooli具有一个生成图表的功能,这是一个稀松平常的功能啦,但是当用户参与到数据筛选的时候,制作一个有意义的图表突然变得有些困难。说到底问题还是学习成本的问题,一个确切知道自己要做什么样图表的用户,做一个折线图再编辑表头就是高大上的边际效益图啊,业务增长图啊,时间直方图啊等等,然而概念不清的用户可能就会先迷茫的做一个图,然后想我做的这个图究竟代表什么含义呢?
图表本身这个功能模块也是分基础图表和业务图表,并且表现形式均为柱状图、折线图等等。我们的方法是以建基础图表为主,业务级图表隐藏在深处,比如我们讲日志条数设置为默认选项,而去重日志数会放在深一级的路径中。我们希望初级用户使用的时候无障碍,当他有天看了几本数据分析的书以后,发现,这个高级分析居然hooli也已经支持。这样类似的功能设计其实还有很多,这也需要我们给出一些官方的使用建议,这也是我们下一步准备做的。
这些基本上就是我们在业务上和产品上进行的创新了。
严尔银:把一堆复杂的数据变成通俗易懂的图形。这是极简理念,并且把图形变成用户心里想要的图形,那是创新服务。目前产品主要应用在哪些领域?已经取得哪些进展?
刘岂骥:我们目前的用户包含各个行业的企业,我们也有关于物联网、银行、运营商、游戏等行业解决方案。由于hooli是实时日志数据分析平台,目前也已经有了不少客户在试用我们的产品,同时也有一些付费用户。
严尔银:目前有哪些主要的技术和市场方面的合作伙伴?满足了他们的哪些需求?
刘岂骥:我们现在在和当当合作,帮助其完成日志分析的需求;和国内某运营商也在合作,主要的方向是更加灵活的花费详单等;我们也有和一些硬件公司合作,因为很多传感器的数据往往以日志的形式记录下来,使用hooli的话可以帮助他们的团队进行日志集中分析处理。
严尔银:好的,请刘总分享一下贵司的近期规划和长期愿景,尤其产品规划?
刘岂骥:近期hooli想通过一些大公司的应用案例打响品牌,后期会推动SaaS版帮助中小公司达成日志数据分析的目的。产品方面的话,保证易用性和专业性是不变的目标。产品发展和迭代本身也会贴紧市场需求,同时我们也会不断打出拳头功能。
严尔银:这个数据分析完成后,除了将精准的结果呈现给用户外,是否贵司还提供基于数据结果给出优化方案?补充一下,这个优化方案是指,根据用户本身的业务内容,基于分析结果后是否针对用户的业务内容有优化方案或建议
刘岂骥:目前hooli给自己的定位是一款工具产品,只具有呈现功能,业务优化的方向在我们提供的咨询服务之中,并不会体现在产品上。毕竟如果一款工具产品能够直接给出优化方案了,这个世界就不需要Boston那些咨询公司了。一个工具产品的本分是展现、提示、弱建议(有时候可能看起来很傻)。
严尔银:ok,建议和咨询公司联合推出个套餐服务。
吐糟环节
李晓妍:你们的产品,面对不同客户的需求时还需要做定制化开发吗?
严尔银:个性化需求,这个可以收服务费。
刘岂骥:是的,哈哈,其实这个问题实际上和部署方式相关。SaaS基本上是我们的标准产品,私有部署的产品,客户提出的需求我们总不能一口回绝对吧。不过我们会根据客户的反馈,让产品符合整个市场的期望,这也是一个B端公司的基本素质。
李晓妍:不是和需求有关吗?比如银行的需求和电商的不一样。数据源不同,分析维度应该也不同,不需要定制化?
刘岂骥:对,一个工具的特点是你做为一个菜刀,砍人和切菜都是能够满足的,我们在数据分析上首先看的是一致的特征,能够满足数据分析的基本要求,至于应用本身,其实说到底都会满足的。数据源我们会做兼容,但不算是功能级别的定制化。
李晓妍:感觉和调查报告的分析系统有点类似,是吧。
刘岂骥:应用上,可以这么认为。
刘磊:您的意思是在几本数据源上保证完整,后期的数据分析和展现通过系统内置工具完成个性化需求吗?
刘岂骥:数据收集、hooli的技术所要解决的海量数据实时性的挑战,则完全不是一个等级的。
李晓妍:这个可以理解,数据量上,调查报告肯定没发比。
刘岂骥:实际上刚开始大家都觉得大数据应用,就是以前的数据分析变了个名字,以为一个噱头,实际上背后的技术变革是很重大的。
李晓妍:从数据分析到大数据,背后的技术变革有哪些?
刘岂骥:这个问题好难回答啊哈哈,感觉可以写一篇论文了。[偷笑]
从数学的角度来说,大数据不再去采样,而是分析全体数据(参考《大数据时代》)
从技术架构的角度来说,大数据从存储(如redis,mongodb)、os架构(hadoop,spark),云的兴起(从aws到阿里云、腾讯云等等)都是翻天覆地的变化。
其实当数据量增长到一定的数量时,量变就会引起质变。
李晓妍:是不是可以理解为本质是足够大的数据量?
刘岂骥:对!
联动i访谈
联动原素旗下
专注物联网时代创新创业的O2O访谈
如果你身在物联网、云计算、
大数据、移动医疗·大健康、
智能硬件、人工智能等领域,
那么不用犹豫,
我们在这里等你!
投稿或寻求报道:sxy@we-up.com
为什么说数据合规是三体问题?【附落地策略】
进群交流
点击此处添加客服,验证入群
活动报名
点击报名数字化科技浪潮峰会
课程报名
点击报名7月合同写审改突破营
本文根据彭凯在2022数据与个人信息合规论坛的分享整理
扫码回看演讲视频
今天要跟各位探讨的是一个很大的话题——金融业数据合规。有人可能马上就会质疑,金融业数据合规这么大的话题你也敢聊?金融行业细分领域这么多,金融业数据合规问题又那么复杂。诚然,金融业数据合规的话题太大了,一次探讨很难聊得深、聊得全、聊得透。因此,本次探讨的主题会偏宏观一些,从方法论和策略选择这个金融业数据合规的基础问题来聊,后续会结合项目经验和金融业各个细分行业的情况,例如支付机构、商业银行、外资保险等,进行更细化地探讨。
先来破一下题目,对几个关键词进行拆解。
第一个关键词:金融业
“金融业”涵盖的业态很多,包括商业银行、证券、保险、期货、信托等等诸如此类的传统业态;还有一些参与其中的组织机构,类似于像交易所、卡组织;以及融资租赁、商业保理、小额贷款等类金融机构,这些机构以前比较难划归金融机构范畴,但随着部分权限上交到了中央监管机构,慢慢地大家也就接受它们应该是会被纳为金融机构或者参照金融机构管理。业态如此之多,就引发了一个话题:为什么金融业数据合规是三体问题?可以从以下三个方面来拆解。
(一)金融业的细分领域
金融业有很多细分行业,每一个细分行业都有相对独立的业务逻辑、业务规则和监管体系,对此其他行业完全无法比拟。细分领域多,监管体系自成一派。从中央层面看,有银保监会、人民银行、证监会,从地方层面看,有金融监管局等,此外还有形形色色的一众自律机构等。
(二)金融业数安个保规范框架
从法的位阶看,金融业数据安全、个人信息保护规范框架大致可以划分为五级分类:法律、司法解释、行政法规、部门规章和“重要的”标准。
需要重点注意的是“重要的”标准这一级规范。在金融行业,国标、行标、团标的重要程度往往更高,因为更能指导实践。早在2018年就有《GB/T36618-2018金融信息服务安全规范》,也有细分领域的比如《JR/T0158-2018证券期货业数据分类分级指引》,对证券期货行业的数据分类分级进行指导。还有三个比较核心的、关注度非常高的金融行业标准,《JR/T0171-2020个人金融信息保护技术规范》《JR/T0197-2020金融数据安全数据安全分级指南》以及最重要的《JR/T0223-2021金融数据安全 数据生命周期安全规范》,内容详尽,体系分明,需要重点关注。如果关注金融数据出境的话,还有两个行标的征求意见稿也非常值得关注,一个是2021年1月4日的《JR/T金融数据跨境安全要求(征求意见稿)》,另一个是2021年11月26日的《JR/T金融数据安全数据安全评估规范(征求意见稿)》。
可以说,金融行业数据安全和个人信息保护相关的规范,在体系性,包括文件的数量和出台的频次方面,在所有的行业中堪称第一。
(三)金融业的标签
从数据安全角度看,可以为金融业划定六个标签:
1、行业规范数量最多
在数据安全和个人信息保护规范体系中,据不完全统计,金融行业的规范数量是最多的,这个结论基本不会有争议。
2、置身于最强监管
金融业的监管机构多,而且各个层级都有可能来管,这两年在金融体系的建设和金融监管上收紧的态势也愈发明显。2022年5月19日,银保监会发布了一个和消费者权益保护直接相关的规定《银行保险机构消费者权益保护管理办法(征求意见稿)》,里面个人信息色彩比较浓厚的条款,出了一些新的内容,甚至出现了一些新的个人信息保护领域的名词,比如“痕迹数据”。
3、细分业态纷繁
金融业的细分业态多,每一个细分行业还会有细分业务。比如银行有存贷两大业务,但是它的业务流程非常复杂,还包含很多其他业务,导致不同的细分行业、细分业务乃至细分的业务场景,其中的数据处理活动和生命周期管理都有比较大的区别。
4、浓厚的消保色彩
金融行业的个人信息保护比其他行业要走得更早、更快、更成熟,很重要的一个原因在于其从金融消费者保护这条线发展而来。很多金融机构,以银行为例,他们的消保部门会在个人金融信息保护项下牵头来做很多事情,这也是在服务部分银行客户时发现的规律。
5、特殊身份认定
金融机构可能会面临天然的特殊身份认定,比较多涉及的特殊身份主要包括三种:
(1)CII/CIIO;
(2)达量个人信息处理者;
(3)重要数据处理者。
首先,可能会触发的是认定为它有CII(关键信息基础设施),进而它就具备CIIO(关键信息基础设施运营者)身份,一旦划定为这个身份,所有的义务层级都会被极大地拔高。
其次,金融机构非常容易触发“达量的个人信息处理者”身份认定。所谓的“达量”,参照《数据出境安全评估办法(征求意见稿)》的条文规定,就是百万级别(处理个人信息达到一百万人的个人信息处理者),这个标准对于金融机构而言,非常容易达成。一旦划定为这个身份,就需要履行个人信息境内存储、数据出境需通过国家网信部门组织的安全评估、设置个人信息保护负责人等更严格的法定义务。
最后,重要数据处理者身份认定。对于重要数据,目前最新的可参考定义可见于2021年11月14日的《网络数据安全管理条例(征求意见稿)》,其中单独定义了重要数据,划分了七个类别,另外还可见于2022年3月16日更新的《信息安全技术重要数据识别规则(征求意见稿)》。关于金融行业的重要数据目录,人民银行会不会来定,怎么定,人民银行、银保监会、证监会是否各自都会出自己的一套认定的目录,目前没有答案但值得期待。需要指出的是,金融数据和个人金融信息,这两个维度,一个沿着数据,一个沿着个人信息,大量的个人金融信息可能都会被归入敏感个人信息;另外金融数据的量级和本身机构业务和机构的属性,会导致它也比较容易被归入到重要数据范畴里面去。但真正哪些划入重要数据,要看数据处理主体身份和数据本身的影响后果(国家安全、公共利益),不是敏感的数据就是重要数据,也不是量大的数据就是重要数据。
6、业务围城
最后一点,金融机构们都在干什么?
(1)数字化升级之“盼”
金融机构速度有快有慢,程度有深有浅,但纷纷都在响应国家数字化升级、数字化转型的政策号召,所以就会有数字升级、数字化转型的期盼。
(2)科技公司/互联网平台的金融梦
另外一方面,大量的金融机构跟外界的互动越来越频繁,比较典型的就是与大型科技公司和大型互联网平台的合作与互动。而这些科技公司和互联网平台,它们本身也一直在做着金融梦,它会去持牌,会去设立或参股银行,拿各个细分领域的金融牌照,所以业务就会在这样的一个围城之下产生互动。大型平台在这两年也引起了金融监管的高度注意,监管越来越意识到互联网金融和金融科技的复杂性、传导性,大型平台的治理要在金融行业构筑防火墙,做相应的业务切割等等。这些都会引发金融业的数据治理重要话题,都会是比较头疼和复杂的问题。至此,第一个关键词拆解完毕。
第二个关键词:数据合规
数据合规其实很早就存在和被谈论,《网络安全法》2016年11月7日出台、2017年6月1日生效,再往前推,公安部有一系列的关于计算机信息系统等的文件。在此之后,数据合规的热度不断发酵,这两年一下子变得热门,数据合规人才招聘难,薪水开很高也招不到想要的人,而且愈发强调需要的人员既要有技术背景,又能有法律背景,恨不得个个全才。从去年的滴滴出行等被实施网络安全审查的案例开始到现在,其实就过了短短的一年不到的时间,《个人信息保护法》也才生效了半年多的时间,怎么就这么热了?以下对这个关键词进行拆解。
(一)两个角度
接下来从场景和特点两个角度来谈一下数据合规。
1、场景
数据合规的场景有“三化”:行业多元化、业务多元化、主题多元化,所以它的场景维度非常丰富。
主要的合规场景主要包含以下五大类:
(1)公司日常治理中的合规;
(2)数据驱动型企业的专项合规,如互联网公司、大数据公司、科技企业;
(3)业务内部自查与外部检查中的合规,这类属于特定情形下触发的合规场景,包括业务载体合规尽调、数据/个人信息生命周期尽调、既有业务合规排查、资方/重要供应商引入下的合规尽调;
(4)IPO进程中的专项合规,这类属于资本市场的新需求,需求方包括主办券商和拟上市主体;
(5)特定需求下的专项合规,场景包括数字化转型、政府招商引资、企业内控体系构建、CRM管理、雇员数据合规、安全评估等。一句话总结,“只有你想不到,没有它不需要”。
2、特点
数据合规领域具有快速迭代与更新的特点,法律法规、各类部门规章以及标准不断在更新,知识库不断扩大,强调从业人员要有一定的法律背景,有一定的技术认知。因此在门槛这个问题上凸显有一定的知识壁垒。
(二)三驾马车
数据合规在立法领域的三驾马车,是大家非常熟悉的《网络安全法》《数据安全法》和《个人信息保护法》。
1、三部法律的关系
三部法律不存在完全的包含与被包含关系,各有不同程度的交集,但在下位法层面呈现出“融合之势”。比如《网络安全法》,除网络安全外,也谈了数据、用户信息;而《数据安全法》中的数据本身就可以把所有个人信息包括进来;《个人信息保护法》则更强调个人信息处理活动的生命周期问题,有大量涉及个体权利的内容,如查阅、复制、更正、删除等,还会有跟第三方交互的相关内容。总结一下,用下面这张图表达三法关系,可能会更清晰一点:
2、各自规制内容及侧重点
(1)《网络安全法》
《网络安全法》规制的是网络安全相关活动,数据方面强调的是网络数据、重要数据,个人信息层面强调网络运营者的用户信息保护,同时还包含等级保护、网络安全事件应急预案这两个重要的义务履行。
(2)《数据安全法》
《数据安全法》强调的是数据,侧重于对数据安全的规制,设置了大量的义务性条款,涉及的主体包括政府部门等监督机构和开展数据处理活动的主体;内容方面,包含了数据盘点与分类分级、全流程内部管理制度建设、安全监测与应急处理,以及数据出境。
(3)《个人信息保护法》
《个人信息保护法》规制的是个人信息处理活动,除与生命周期强相关的义务性条款、与第三方交互强相关的义务性条款(共同处理/委托处理/对外提供/跨境传输等)外,还设置了体系性的权利保护条款(查阅、复制、更正、删除等),更加侧重于对个人信息的保护;涉及主体除政府部门等监管机构、个人信息处理者外,还包括个人信息主体。
《个人信息保护法》包含三大板块,一是个人信息生命周期的处理活动全流程的管理;二是与第三方数据的交互,包括从数据源开始,有的个人信息由C端用户直接提供,有的个人信息通过与外部合作机构的共同处理、委托处理等获取,此外还会涉及个人信息的对外共享、跨境传输等等,引发的就会是要求在隐私文件制度构建还有供应商数据合规管理这些问题上全部要去进行落地;三是个人信息主体权利的响应,《个人信息保护法》对个人信息权利进行了体系化地规定,就是上述的知情、决定、查阅、复制等等一系列权利。
与《数据安全法》相比,《个人信息保护法》相关条文的“丰富度”更胜一筹,而行政色彩则相对较弱;从影响力而言,《个人信息保护法》对相关主体业务模式的影响最大,个人信息的生命周期管理成为开展数据合规工作的重点;此外,重要数据识别、本地化存储、跨境传输的重要性凸显,上升至“数据主权”层级,相关的配套规则将持续高频出台。
第三个关键词:落地策略
金融业的业务复杂性等多种原因,导致该领域的数据合规成为一个很复杂、很难解决的问题。但是,面对这么复杂的一个问题,还是应该积极地应对。怎么做呢?第一个建议,三体问题可以用三体办法来进行适度地应对。
(一)三体应对办法
所谓的三体应对方法分为三个方面:规治“体”系、架构“体”系、业务“体”系。
1、规治“体”系
规治“体”系是对法律法规当中的“规”有一个比较清醒的认知和相对全面地学习。
首先是“规”。前面埋了个伏笔,金融业从法规数量来说是各行业的Top1,对此有统计数据作为支撑。据不完全统计,截至2021年年底,通用型规范有180多个,而金融行业就已经有140多个,远超电商、快递等其他细分行业。所以这个是第一步规治体系当中的“规”要学。
其次,要弄清楚“治”。弄清楚治理及管理主体,其实就是对监管体系要有清醒的认知,对各个监管部门的口径、指导案例的资料,要定期学习和更新。就目前的规治体系,可以八个字总结,即“九龙治水,自上而下”。
九龙治水的局面在个保和数安这个领域至今并没有得到解决,仍然存在。治理和管理主体包含六大板块:
(1)统筹管理部门,包括中央和地方的网信部门、工信部门、公安部门、市场监督管理部门、国家安全部门;
(2)专项监管机构,包括App专项治理工作组和网络安全审查工作小组;
(3)行业监管机构,包括中国人民银行、银保监会、证监会、食药监、教育部、民政部、交通部等;
(4)技术工作组织,包括国家计算机病毒应急处理中心、信息安全标准化技术委员会、国家认证认可监督管理委员会、网络安全审查技术与认证中心等;
(5)自律组织,如消费者协会、互联网协会、支付清算协会等;
(6)个保公益诉讼专项机构,它专门指向的是个人信息保护领域,包括检察院、法律规定的消费者组织、国家网信部门确定的组织。
2、架构“体”系
企业需要建立自身内部的架构体系,比如风险管理体系(安全策略、数据安全风险管理)、数据安全生命周期(数据资产管理,采集、传输、储存、使用、删除、销毁方面的安全管理)、数据应用安全(数据应用安全及个人信息安全)以及数据安全保障(供应商数据安全管理、数据安全事件管理、连续性管理及数据安全检查评估)。上述体系应当在公司架构与文档分级两个层面有所映射。
(1)公司架构
公司架构偏向于公司治理方面,比如母子公司架构、关联公司架构、部门架构设置、人员岗位设置。
(2)文档分级
文档分级是指企业在做制度文本、各种各样的指引预案的时候,可以做四级划分,一级文档为方针/总纲/策略,二级文档为制度/办法,三级文档为指引/规范/指南/模板,四级文档为记录/日志/表格/报告。
(3)架构参考
企业的架构体系,应当是多个部门联动合作,共同进入到体系中来解决问题,最重要的还是要让制度落地。
在架构体系方面,《JR/T0223-2021金融数据安全数据生命周期安全规范》已经做了指引,可以供金融机构参考。决策层、管理层、执行层、监督层四个层级设置,每一个层级应当设置哪些部门,应当由哪几个部门进行合作,在该规范中都比较清晰。此外,数据安全原则、数据安全分级、数据生命周期安全防护要求以及组织和运维的保障都规定得比较清楚,建议金融机构根据该规范建立或完善自身的架构体系。
3、业务“体”系
首先要进行行业识别,企业要清楚自身属于哪个行业类别。
其次要进行业务识别,企业需要关注四个方面的内容:
(1)充分理解自己的主营业务模式,这是起点;
(2)考察业务流程,这是重点,因为业务流程往往是与生命周期相对应;
(3)同时关注主营与非主营业务,非主营业务也包含了跟大量外部各个行业的机构产生的互动与合作;
(4)关注业务牵连。
最后要关注业务与合规要求是否适配,这种适配性体现在公司架构、员工岗位、业务管理制度、数据盘点、生命周期梳理等多个方面,还有具体业务所特有的网络安全、数据、个保合规要点。
以上就是金融行业数据合规的“三体问题”的三体应对办法。需要指出的是,这里是应对方法,而不是解决方法,具体解决还是要具体情况具体解决。
(二)按图索骥
所谓的按图索骥是一种正面执行的方法论,建议分四步走。
1、构建合规表单
企业需要搞清楚自身有哪些合规义务,可以从三个方面去构建这个表单:
(1)合规文件的详尽梳理与列明;
(2)执法司法案例的关注与考察;
(3)监管口径的问询与同行了解。
2、确立合规主题
不同主题的合规义务不尽相同,企业要先确立自身的合规主题,常见的包括网安等保配套制度的更新、数据安全管理细则、个人信息保护内部指引、App/小程序合规指引、个人信息保护影响评估、个人信息主体权利相应机制等等。
合规主题代表的是企业自身的需求,在确立主题过程中需要企业去梳理自身哪些业务场景会涉及到该合规主题,进一步,在这样的业务场景中,数据流向如何,可能涉及哪些部门或人员,各参与主体的权限等等,梳理的过程也是企业了解自身实际状况的过程。
3、合规表单需求适配
有了合规表单,再确立合规主题后,对二者进行差异性分析。结合合规义务和自身现状,通过内部自查和访谈,外部律师等专业机构的介入,找到差异,最后得出对应的诊断结果。
4、安排合规改造
诊断结果出来后,最后一步是安排合规改造。
这个过程主要包含以下七个方面:
(1)确定参与的部门;
(2)配置相应的人员;
(3)制定改造计划;
(4)文本呼应,比如内控制度、外部协议、隐私政策、应急预案等;
(5)制定实施方案;
(6)促使改造落地;
(7)宣贯备案,举个例子,对于金融机构的合规改造,有必要对客服进行宣贯,比如用通俗的语言去宣贯,把一些营销、客户沟通话术中的个人信息保护重点问题讲清楚,用案例等生动的形式能够让他们更好地理解和接受,还要告诉哪些话可以讲,哪些话不可以讲,哪些话要慎重讲等等。
总结来说,正面执行就是把握好三个点,一个法律法规到底对自身的要求是什么?自身的业务和场景里面的实际情况和需求又是什么?前述需求和要求怎么样去适配?适配出来的成果,就是接下来要去按图索骥落地的内容。
(三)按图索骥的演示
接下来演示一下如何实践这个方法论。
1、构建法律法规数据库
首先构建数据合规领域的法律法规数据库,根据自身的行业及业务属性,找出强关联的规范;然后将这些规范进行拆解总结,拆解的时候需要留意自身确立的合规主题;最后要把纳入数据库的规范进行总结,形成相应的标签,未来业务需要时可以通过搜索关键词的方式快速找到相应的规范。
2、业务场景梳理
紧接着需要梳理自己的业务场景和子业务场景,需要梳理业务场景下的数据流向、数据提供、数据接收、数据分类分级情况、存储情况、使用情况、数据保护能力、处理活动定性、外部数据调取、监管机构关注、合作机构关注等内容。这个过程最好由公司高层来发动,因为牵涉到多个部门。这个梳理过程,也是为自身的数据资产做盘点,为数据合规做铺垫。
3、形成数据合规框架
最后将法律法规数据库和业务场景进行差异化对比,形成合规框架。三层架构从基石到核心到保障,每家机构可能会有一些不同,但大体趋同。
4、制作具体主题表单
对于出境、个保影响评估这类有特殊要求的具体主题,可以制作成可视化的表单。其中,个保影响评估,数据出境风险自评估,该等评估的表单可以自行设计,发挥主动能动性,充分考虑在告知同意方面应该做什么,合作方应该配合做什么,评估涉及的各方主体应该如何协调配合去完成评估,前述内容如何呈现在最终的评估报告中。
此外,年度的个人信息保护审计的自查表,也可以自行制作。做数据合规,切忌永远都是想着像以前做尽调一样,出那种动不动几百页的报告,很少人看,它只解决当下的问题。建议借助一些工具,比如借助前述合规表单,然后让这些表单能够活动起来,互相关联起来,让该等合规表单不断更新,不断复用。不管是作为律师为客户提供数据合规服务,还是客户内部的工作人员自己去留底,数据库的建设到前述合规表单的流传,不停地更新、不停地复用,它们的生命力会更顽强。
最后总结一下,结论是可以用“三体”(规治“体”系、架构“体”系、业务“体”系)去应对金融业数据合规领域的三体问题,注意可能会解决不了,只能是应对,然后按图索骥一定要正面执行。今天就跟大家分享到这里,谢谢大家。
彭凯
金诚同达律师事务所高级合伙人
彭凯律师毕业于厦门大学法学院,获得硕士学位,现为金诚同达律师事务所上海办公室高级合伙人,专业领域涉及金融科技(Fintech)、网络安全与数据合规、公司收并购及争议解决等。彭律师专注于互联网、新金融行业及各类新兴业态的合规实务,为多家金融科技企业、互联网机构、初创公司提供了常年及专项法律服务。
文末彩蛋
做最懂企业需求的法商培训
重庆翰海睿智大数据科技股份有限公司电话是多少?
重庆翰海睿智大数据科技股份有限公司联系方式:公司电话67185595,公司邮箱hesongyu@***.cc,该公司在爱企查共有6条联系方式,其中有电话号码4条。公司介绍:重庆翰海睿智大数据科技股份有限公司是2016-08-31在重庆市渝北区成立的责任有限公司,注册地址位于重庆市渝北区仙桃街道数据谷东路19号。重庆翰海睿智大数据科技股份有限公司法定代表人卢山,注册资本1,010万(元),目前处于开业状态。通过爱企查查看重庆翰海睿智大数据科技股份有限公司更多经营信息和资讯。
济南万宇大数据科技有限公司是培训机构来自吗
济南万宇大数据科技有限公司不是培训机构。济南万宇大数据科技有限公司作为一家及软件开发、云计算、数据处理和存储服务、计算机软件开发、信息技术咨询服务于一体的感科技公司。