爆郑爽偷税亿元?我发现了AI金融「几个亿」的新商机2020年盗版损失超60亿元,

导读: 澎湃新闻记者 范佳来 搬砖间隙摸鱼冲浪,突然发现所有社交平台被“郑爽日薪208万元”刷屏了: 随着网络文学发展成为文化产业重要的IP源头,版权保护直接影响创作是否可持续、文

丝瓜网小编提示,记得把"爆郑爽偷税亿元?我发现了AI金融「几个亿」的新商机2020年盗版损失超60亿元,"分享给大家!

澎湃新闻记者 范佳来

搬砖间隙摸鱼冲浪,突然发现所有社交平台被“郑爽日薪208万元”刷屏了:

随着网络文学发展成为文化产业重要的IP源头,版权保护直接影响创作是否可持续、文化能否高质量发展。

女艺人郑爽的前男友张恒爆料,郑爽通过阴阳合同在《倩女幽魂》项目中获得收入1.6亿元,按77个工作日计算,日薪超208万元。

4月26日是第二十一个世界知识产权日。易观智库发布《中国网络文学版权保护白皮书》(下文简称“白皮书”)显示,“盗版之殇”依旧在困扰网络文学的发展。

那按月薪1万来算,咱们大概要工作17年才能赚到爽子一天的钱(……)

你以为我还会在乎吗,这个数字已经伤不到我了,我在大润发杀了十年的鱼,我的心已经和我的刀一样冷了。

本文图片来源:《中国网络文学版权保护白皮书》

还是很在乎的,怎么样让老板看到这个消息呢

白皮书提到,截至2020年12月,中国网络文学用户规模达4.6亿,占网民整体的46.5%。

整体市场规模288.4亿元,盗版损失规模达60.28亿元,同比上升6.9%。其中,新技术滥用、传播途径杂多和全产业链覆盖是盗版现象越发严重的三个主要因素。

全职创作者被侵权比例超过九成

付费阅读是大部分网络文学作者的主要收入渠道。白皮书数据显示,54.8%的创作者通过网络文学写作赚取额外收入或零花钱,33.1%为全职作者。其中,大多数创作者遇到过不同程度的侵权,其中频繁遭受侵权的比例超过四成,仅14.6%的创作者表示未经历过侵权事件,全职作者侵权比例高达94.2%。有53.8%的全职创作者频繁被侵权,占比显著高于整体创作者。

“我们写作时间很长,需要集中精力,尤其是写长篇小说的时候,让我自己提供盗版追溯、举证的过程非常困难。”《锦心似玉》作者吱吱表示。“有时候感到很迷茫,我写的作品没有给自己带来更多读者,反而成为盗版网站敛财工具。”

她提到,一些盗版平台密切关注知名网络文学作家的新书动态,一旦作家发布新书预告便抢先注册书名,用劣质内容填充,诱导粉丝阅读,通过流量变现等商业模式获得巨额经济利益,直接造成作家的收入损失,严重打击作家的创作热情。

其中一个著名现象就是“笔趣阁”。第一家“笔趣阁”创立于2012年,是一家专门连载盗版网文的网站,后被作家维权关闭。但不久之后,无数与“笔趣阁”同名的盗版网文网站涌现,在百度上搜索“笔趣阁”,依然能查到超过1000万个搜索结果。有网文作者曾在网上搜索自己更新的小说片段,前一秒钟发表的更新,后一秒就能在“笔趣阁”上出现,而且一字不差,非常准确。在中央电视台的一次专题报道中,一位网文作者在采访中现场上传了一个章节,两分钟之后就在笔趣阁里出现。

根据张恒的描述来估算,爽子这一年劳逸结合能赚6.4亿。

……BATJTMD看了都直呼好家伙

相比之下,逛超市不付款、对宠物狗不负责之类的瓜好像都是洒洒水了……

重点是,在张恒的“雷神之锤”五分钟小视频里,各种证据还锤了郑爽涉嫌“偷税漏税”“阴阳合同”:

网络文学存在“维权难”

详细的瓜不放了自己去八卦号看吧

网友怒生一计,建议以后明星的实绩就以纳税额来算。

什么专辑销量电影票房品牌代言杂志封面,都不如为国缴税来得直接√

白皮书提到,面对侵权现象,坚定选择维权的作家比例只占51.2%,有近一半的创作者处于犹豫阶段,不确定是否还会选择去维权,需要视侵权严重程度,看维权难易度等因素而定,明确表示不会去维权的创作者比例仅为2.3%。

虚假的打工人还在被明星的高薪水深深刺痛,但真正的打工人,已经发现了一个巨大的商机。

作为本行业资深top500000的一位观察者,我敏锐地意识到:

AI用于反偷漏税,用于审查阴阳合同

在网文作家“国王陛下”看来,维权行动不积极的主要原因是维权成本高、过程复杂和消耗心力。如果案件进入诉讼程序,维权时间的不确定性也是主要问题。“作者能做的其实比较有限,主要是为正版用户提供好的内容,比如互动内容。以及积极呼吁大家提高版权意识。考虑到创作者通常会与平台方签约,平台方需要继续提升版权管理效率,为创作者提供专业的法律支持和维权服务,帮助创作者走出维权难的困境。”

盗版的泛滥与许多读者的阅读习惯也有关系。“教科书会买正版,但是网文看看盗版就可以。”许多读者怀有类似的心态对待网络文学,而网络文学在线消费特征,也容易成为盗版问题的“重灾区”。对于IP“真爱粉”来说,他们对盗版行为的排斥仅限于自己喜爱的IP及其相关产品,无法将支持正版的行为一以贯之。

这不就是现成的AI金融应用场景吗!

这要是能安排上,前面的按税排番,肃清娱乐圈风气,岂不是指日可待?

但是不是真的可行,当然还是要大胆假设小心求证。

随着IP全版权运营持续成熟,“影视放大器”推动网络文学IP快速“破圈”的效应更加明显,原著的影响力得到进一步放大,这也带动了盗版现象向全产业链衍生。以今年走红的电视剧《赘婿》为例,在网上搜索“赘婿TXT”,会出现超过400万条搜索链接。盗版平台通过快速上线盗版原著、搜索引流等方式,将部分新增读者转化为盗版读者,使热门网络文学作品的盗版现象更加严重。

我们与数家AI金融公司简单聊了聊,发现这类技术解决方案做得并不算多,只是有些风控方案中会考虑纳入税务数据作为参考维度。

真正做AI 反偷漏税的玩家,似乎十分低调。

治理盗版初见成效,版权保护任重道远

一位较著名的杭州AI独角兽透露,他们与杭州某区曾经合作搭建税务平台,由他们提供部分模块的建设,但他们也强调:

白皮书中提到,横向对比视频、音乐、游戏等数字内容产业,网络文学的版权保护难度更大、形势更严峻:一是新技术让盗版产业链隐蔽化、成熟化趋势越发显著;二是盗版平台积累了大量流量,商业变现依赖搜索引擎、广告代理商等利益相关方,多方利益输送增加了打击难度;三是正版意识在用户市场的全面推广与培育还需要时间。

“这事儿还是得政府牵头完成。”

啊这,难不成这事儿很有难度?

文因互联的CEO鲍捷博士和我们是这么说的:

阅文集团首席执行官程武认为,对于文学生态来说,作家们的创作是第一生产力。随着网络文学发展成为文化产业重要的IP源头,版权保护直接影响着创作是否可持续,文化能否高质量发展。保护版权,就是保护作家的创新力,保护文化创意产业源头的驱动力。

“我认为这没有任何技术难度,但难就难在税务数据的打通,和税务模型的构造上。”

清华大学法学院知识产权法研究中心主任崔国斌建议,改善网络文学盗版泛滥的现状,可以从几个方面入手:首先,强化用户法律责任。网络带给每个人更多表达的机会,但更多的自由同时也意味着更严格的责任,同时,也要强化网络的服务运营商的相关责任。第三,面对网络文学向全产业链延伸的现状,需要司法解释做进一步优化,把后续的非传统意义上版权的保护内容规则进一步具体化。

而中国政法大学知识产权法研究所副所长郑璇玉也提到,要降低权利人的维权成本。“技术的进步使得侵权行为升级,却没有让作者保护模式和手段也随之提升,所以在网络文学盗版侵权的治理中,应该充分利用互联网技术的发展成果。”

我们:什么?居然不是很难吗?

鲍老师:常见的避税手段就这么多,可以拿足够多的财务报表去训练模型,去计算相关结果有没有偏离财税比率。

如今,网络文学已成为文化行业的靓丽风景线。“作家们的创作是文学生态的第一生产力”,阅文集团首席执行官程武表示,保护版权,就是保护作家的创新力,保护文化创意产业源头的驱动力。白皮书数据显示,去年,中国数字娱乐核心产业规模达6835.2亿元,其中网络文学市场规模288.4亿元,行业收入主要来源于用户付费和版权运营。特别是通过IP全版权运营,网络文学间接或直接影响了游戏、影视、动漫、音乐等合计约2531亿元的市场,即网络文学及其IP运营对数字娱乐产业的影响范围超过40%。

鲍老师:我觉得这没有什么太强的科研要求。

我们:……

如果拿不到政府机构内部的数据,用外部数据来操作,可行吗?

技术大佬:倒也没有很可行。

责任编辑:梁佳

校对:张亮亮

一位不怎么知名的机器学习工程师,就跟我们详细地掰扯了一下AI 反偷漏税的应用逻辑:

AI本质上能做的是学习相关性。

那对查偷税漏税来说,可以寻找某些数据指标和真实收入之间的关联性,预测大概能挣多少钱,然后实际报税收入没那么多就是一个怀疑的理由。

从最单纯的情况开始——

假设某平台上一亿粉丝、每日一亿互动的明星一年拍2部戏有10亿收入,2千万粉丝、2亿互动的可以有1亿收入。

抓取的数目项目越多,比如囊括更多平台更多数据、囊括每年有多少广告合作,对实际收入的预测就有可能越准确。

榜单很多,不要问我哪个才是最准的

但这仍然是很难的:比如公开的数据并没有标准格式、需要大量的清洗整理;

比如娱乐圈的市场报价,对外行人来说,也根本就不是公开的。

另一方面,明星每年实际报了多少税,只有税务局自己知道;

这些报税数据,也本来就应该属于个人隐私,所以也只有税务局自己建立一个这样的系统,才能拿到这一头的数据。

再接下来,即便模型显示预测的收入和实际报税收入有差距,也还是一个很弱的证据,为了能具体确认数额和处罚,还是需要人工找到具体的偷漏税的合同。

说到底,就算真有这样的系统,帮助也不是很大吧。

还有业内人士接着吐槽数据打通问题:

中国证券公司系统发展二十几年了,交易所之间、证监会和交易所之间的数据都还没打通呢,估计税务部门也是一样。

此前也有报道:

目前,各省的数据库都是相互割裂的(企业在全国各地有分支机构的逃税更容易),在AI系统下,政府所有的数据库,包括财产、商品、国际贸易、商业登记等数据信息,将会连接互通。

比起技术本身实现的难度,对于税务数据的来源、归属和打通,其实才是问题的关键吧。

业内人士还想吐槽:还没有到用大数据抓偷税漏税的时机呢,税务局到底有没有必要来做这些事情——

我们:好了谢谢您,后面的内容放出来咱们就很危险了

不过之前AI 税务有没有呢?其实是有的。

在国外,这种应用已经红红火火地用起来了,比如Intuit就是一家智能财税软件巨头,C端拳头产品Turbo Tax就是帮用户准备报税。

但说实话国情差异比较大,外国要填的税单复杂到三天三夜都说不完,这部分的详细介绍我们有空再说。

具体到AI 税务的应用方向,之前就已经有人梳理出了这么几类:

第一种,帮税务人员做表,重复的流程都替代掉。

第二种:扫描税务报告。

这就与OCR(光学字符识别)有关了,OCR AI这对组合拳可以让文本内容扫描并上传至数据库内,这不比翻纸质文件香吗?

第三种:帮税务人员看文档。

这个大致也涉及语义理解方向,比如分类凭证和文档,从中提取关键数据,像是企业营收,应收应付款项,税单折扣额度之类的。

前三种可能算是青铜级别的难度,其实最近两年大热的RPA已经在做类似的工作了,财税也正好是RPA在金融领域规模化部署跑得最快的一个场景。

(对RPA AI 金融感兴趣的话,可以看我们写过的:来也科技/艺赛旗/文因互联/云扩科技/达观数据/弘玑/平安科技etc.)

白银级别的,就上升到预测税负、分析税收趋势。

黄金级别的,就是发现逃税、漏税,提高税务领域透明度的水平了。

比如借助机器学习算法,快速识别出大型数据集内包含的异常条目;

比如基于多种指标检测欺诈活动,例如对方的就业情况、以往是否曾经接受审计,以及与非法收入来源相关的蛛丝马迹。

其实早在2019年底,就有报道讲过AI反偷税漏税了:

AI系统已嵌入到金税系统的核心,后者是国家税务总局使用的软件,是国家金税工程中开具国税增值税发票的开票子系统。

据了解,该AI系统由北京金税的主要承包商航天信息股份有限公司,与哈尔滨工业大学和北京邮电大学的科学家合作开发。

航天信息旗下的航天金税,就是国家重点工程“金税工程”的北京地区服务商。

给大家画几个重点:

可以标记超过95%的违法行为,包括一些大多数税收征收者不熟悉的新手法;

已经在东部几个城市进行试点,取得了“非常积极正向”的效果;

过去三年(那就是2016~2019期间?),有近30万税务稽查人员,一直在参与调试;

这套系统能自动升级算法,保证与最新的税收法规保持一致;

能连通政府的所有数据库,税务稽查更高效;

AI通过交叉检查,从中找出虚假数据,做出标记,最终查出逃税;

不仅是企业逃税,个人逃税也在调查范围。

报道举了两个例子:

1.一家建筑公司在报税时,为了增加抵税,夸大了水泥的价格。

AI能把公司的报价,与当时的市场均价比较,数据异常则做出标记。

2.有的企业为了减少应税收入,会以不合理的低价格,将产品出售给关联公司

数据连通后,公司的分支机构,产品的市场价格,都会被自动检测出来,然后被标记。

当时南华早报的报道里还说到,研发人员表示,范冰冰那样的九亿事件将会成为历史!

但那个时候郑爽已经过上了日薪208万的快乐日子。

写到这里,收到一个好消息:

郑爽涉嫌签订“阴阳合同”、拆分收入获取“天价片酬”、偷逃税的事情,上海税务和北京广电部门已经依法介入调查。

也有传闻说,娱乐圈新一轮的查账又要开始了。

好了,今天的亿点点商机分享就到这里,咱们下一次赚钱机会(合法的那种)再会。

一个预告:AI 反偷漏税、AI 反洗钱、AI 证券监管……这些监管科技的新机会,我们将会为大家带来系列报道,敬请期待。

参考来源:机器之能、南华早报、南方plus

雷锋网雷锋网雷锋网

丝瓜网 crfgs.com