舆情监测系统的自我吐槽——你们真的了解我吗?

舆情监测系统的自我吐槽——你们真的了解我吗?

舆情监测系统的自我吐槽——你们真的了解我吗?

大家好,我是甲壳虫网络舆情监测。
舆情高速发展的这十年,大家对我也有了很深的了解,可是我依然是大数据行业的一个笑话。
如果你还对我不了解,想更多的了解我这个笑话,就继续往下看。
在大数据行业的大家庭里,我属于最勤劳,也是最贫困的那一个,而且被人对我的要求很高,此话怎讲?

1.人们眼中的我

别人一出场就是几百万,甚至上千万的身价,而且被评价高富帅。
我呢?在别人眼里几十万身价都是被高估了。
还经常得到各种各样的要求,如果达不到要求就被out。

(过去的我)
开始的时候我是朴素的,就像过去的黑白电视机。也许那时没人在意我的样子,因为他们更关注通过我能看到多少数据。
可是现在的我,被要求穿各种各样的衣服,还有化妆打扮,于是我现在也变的时尚起来了。
不光可以在小场剧表演,也能上的了大舞台。
有时候我是这样的
有时候我是这样的
有时候我还是这样的
登上大舞台的时候我也是这样的
可是不管在我变成什么样子,到头来别人对我的第一要求就是第一时间,全面、精准地发现舆情。

2.别人眼中工作的我

在人们眼里,我的工作出了成绩,他们不会对我有什么赞扬,也不会把功劳归于我的身上,但是如果我漏了一条数据,或者预警的慢了就受到工作人员的指责,甚至谩骂——什么破软件。其实很多时候,我的错误也不能归结于我的错误。
(第一次)
(第二次)
(第三次)
(第四次)

第N次
周而复始,在问题中成长,在成长中产生问题,但是问题还是那些问题,成长也是问题频率变低而已。
也难怪人们会对我不满,有时候我也会出现这样的情况:
是金子还是垃圾分不清
(垃圾放到了金库)
(金子倒入进了垃圾桶)
不管怎么样,我也在努力纠正自己的错误,让对的真的对,让错纠正到对。
于是,好多人不再相信我,人工智能也被理解为“有多少人工,就有多少智能”。让人类参与到我的工作中,形成新的模式“人机结合”。

3.实际工作中的我

可是有多少人了解实际工作中的我呢?接下来我给大家看看我复杂的工作内容:

网站收集、并把每个网站、甚至每个网站下的每个栏目都需要按网站规则配置,进行数据采集和网站管理。
分类:新闻、论坛、微博、微信、纸媒、视频、手机APP、问答、搜索引擎等媒体分类。
技术手段:网站不同语言的采集、网站不同编码的转换、IP代理池、模拟器、模拟登录采集、API接口等等;
语言分类:汉语、维语、蒙语、藏语;英文、德文、日文、韩语、法文等等不同语言类型;
字段提取:标题、正文、时间、作者、URL、频道等等;
数据存储:mysql、MariaDB、Oracle、SqlServer等等;
搜索引擎:Solr、ES(Elasticsearch)等;
数据分析:实体抽取、地域抽取、企业识别、人物识别、情感判断、热点分析、重要性分析、相似性识别、相关性分析、观点抽取、分类归纳等等;
数据展示:匹配关键词、匹配逻辑规则、匹配地域、匹配人名、匹配网站、匹配作者、匹配热度值、匹配相似、排除无效的、排除错误的、排除歧义的等等的规则进行数据展示;有时候需求走势图、柱状图、饼状图、有时候需要矩阵图、传播图、扩散图等等;
还要交互好、速度快、展示美观、表达清晰等等;
在经过了一些列的流程处理后,我得保证让每个人看到我暂时的数据结果是他们想要的。
每天上亿的数据和无数的数据规则处理,7*24小时一年365天都是如此,让我身心疲惫,可是我从来没有怨言。
发生舆情时,我可以预警;
发生舆情后,我可以统计分析;
处置舆情后,我可以验证结果;
汇报舆情时,我可以撰写报告;
开会、培训时,我是大屏;
工作忙时,我就是手机;
数据整理时,我就是PC;
我参与了舆情工作的整个过程,但是人们却很少理解我的苦劳。

4.我也是需要学习的

其实我不是一成不变的,这么多年来,我变的速度更快了、采集的数据更多了、数据分析的也更准确了,应用场景也更多了。但是我还是一个小孩,我需要更多的学习、更深入学习,我也在不断地摸索我的生长之路。可是大家给我的时间和投入却很少,我成长的慢,是每个使用我的人都有责任的,你们给我投入的资源和资金太少了。
不同的行业:政务、金融、汽车、医美、能源、教育、交通、安全、食药、地产、化工等等我都需要了解他们,只有深入的了解这些行业,探索他们的需求、场景、资讯价值才能更好的帮他们做好舆情监测。而我也在一点一点的专研每个行业。

5.未来可能中的我

未来我并不知道自己会是什么样。但是我清楚的知道自己,在大数据时代下,人类的所属行业要健康发展必然会防控风险,寻求机遇。而我是在防控舆论风险上有着天然优势,在寻求机遇上也存在着挖掘情报的能力。外来的我,不会只是告诉人们发生了什么事,也许我还会告诉大家前方有条大路通向罗马,那里有更多的机遇帮助大家发展。

admin

留下您的信息