金数据帮助中心

如何减少刷票或减少无效数据的收集

对于投票、调查类的表单,往往会遇到随意填写或刷票的数据,这些数据不仅浪费提交量,也影响分析结果。从技术上讲,刷票不能完全避免,但通过一定的限制,能够提升刷票成本,降低刷票机率,从而降低垃圾数据的产生。

注意: 系统上的任何限制方式都无法保证百分百规避掉刷票用户。

以下是金数据根据这类表单的特点,总结的一些制表设置时的建议,希望能帮助你获得高质量的数据。

1. 限制填写权限

开启方法:进入表单页 —— [人群管理] —— [填写规则]。

  • 所有人可填 杀伤力:★

这是默认设置,打开表单的任何人都能够不限次数的提交数据。

  • 仅金数据用户可填 杀伤力:★★★★

用户需要登录金数据才能填写表单。如果没有金数据账号,则需要先注册一个账号后才能填写。这个限制可能会因为注册流程,导致潜在填表者望而却步,但能够极大的增加刷票成本,提升数据质量。

  • 仅管理员可填 杀伤力:★★★★★

这个配置主要用于内部数据填报,无法被外部人员填写。

  • 每设备限填一次 杀伤力:★

该限制依赖于用户浏览器的 Cookies。如果用户禁用 Cookies 、每次提交后清除 Cookies 、更换多个浏览器或填写设备填写,该限制都将失效; 如果在微信中填写表单,用户退出微信会自动清除 Cookies,也会导致该限制失效。该限制对于机器刷票或清除 Cookies 刷票毫无帮助。

  • 每 IP地址限填一次 杀伤力:★★★

该限制对机器刷票有较好的抑制效果,但容易误伤。因为学校、公司等公共场所的对外出口只有一个或者几个 IP 地址,来自这些区域的填表者会无法正常提交;来自省内同一个运营商的手机用户,也可能是通过有限的 IP 地址库来访问互联网,这些用户也有可能无法正常提交。

  • 每微信 OpenID 限填一次 杀伤力:★★★

需勾选[仅限在微信中填写]并且开启[收集用户微信信息]时才可用。

微信 OpenID 是微信用户在公众号 AppID 下的唯一用户标识,可用于永久标记一个用户。但 AppID 不同,获取到的 OpenID 就不同。即:若用来收集用户微信信息的公众号发生改变,同一个微信用户的 OpenID 也将发生改变,该用户有可能会再次提交数据。

  • 限制地区填写表单 杀伤力:★★★

基于IP|TCP 协议实现地区限制: 限制填写地区基于填写者 IP 实现,IP|TCP 协议是当代互联网的基础。在网络通信中,IP 既难以被伪造,又无需表单填写者额外操作或授权,高效且可靠。

注意

  • 关于少量地址解析错误的情况说明: 通过 IP 获取用户所在区域,是依赖于 IP 地址库。当运营商调整 IP 地址段分配,而 IP 地址库未及时更新时,会导致被调整的 IP 地址段解析到调整前的地区,因此会出现少量地址错误的情况;如遇此情况,建议适当扩大限制范围。如:限制某市可填,可扩大到周边地级市可填。你也可以向我们进行反馈。

  • 由于手机设备商或运营商原因,IP可能不准确。比如:西安联通的手机设备,在北京打开时,可能IP还是西安。

2. 限制数据收集的时间|数量

杀伤力:★★

开启方法:进入表单页 —— [数据收集] —— [表单开启|停止]。

  • 表单开启|停止: 如果你的表单已经不需要再收集数据,可以直接关闭。关闭后就不再收到任何新数据了。
  • 设定开启|停止时间: 相当于一个自动计时器,可以设置从 XX 日 XX 分 XX 秒自动开启,至 YY 日 YY 分 YY 秒自动停止。
  • 设定每日开启时段:与上条一样的功能,但细化到以天为单位的循环。
  • 设定数据量上限: 限制该表单总提交数据量。可以随时修改,比如:将数据量设置为 700,下周一可以改为 1400,这样就可以控制每周的数据收集量了。

3. 使用手机字段

杀伤力:★★★

[手机]字段是减少刷票行为最重要的工具之一,它不影响正常的填写者,还可以大幅提高刷票成本。

  • 必须填:勾选后,用户必须填写正确格式的手机号后才能提交。

  • 不能和已有数据重复:同一个手机号码只能填写一次。

  • 白名单:可以设置白名单内的手机号才能填写。

  • 使用短信验证:必须输入手机验证码才能提交。即:只有真实有效的手机号码才能提交数据。虽然会消耗短信量,但是极大的提高了数据的有效性和减少刷票行为。

  • 获取验证码前需填写图形验证码:开启短信验证会默认勾选此项,防止手机验证码滥用。有效的减少刷票行为。

4. 字段白名单

杀伤力:★★★★★

开启方法:进入表单[编辑页]中添加相关字段后,在右侧的[编辑字段]中勾选[白名单],点击设置即可。

如果你的表单只希望公司内部、你已经知道姓名等信息的人才能填写,可以使用此功能。目前[姓名]、[手机]、[单行文字] 这三种字段可以设置白名单。设置之后,只有在白名单内的数据才能正常提交。这也代表了此表单基本无法被外人填写。

5. 把表单变得复杂

杀伤力:★★★★

开启方法:进入表单[设置页] —— [数据收集] —— [填写设置]。

  • 凭密码填写:主要用于信任的人的填写。除了知道密码的人,其他人无法填写表单。

  • 提交前需填写验证码:通常防止机器刷票的垃圾数据提交。

  • 禁止在微信中分享:打开此选项后,在微信中浏览此表单时,填表者将不能选择将此表单分享到朋友圈、QQ等三方平台,也不能转发给朋友。有效减少无效数据的收集。

6. 其他设置

如果你对数据质量的要求非常高,还可以参考以下原则来设计表单:

  • 提供至少一个以上需要用户输入的字段。该字段可以是姓名、电话号码等,并且设置其中至少一项为必选、不能重复。

  • 对于某些关键问题,可以采用同一个目的、多个问题反复问的方式,获得真实数据。你在后期筛选的时候可以通过组合筛选,过滤掉这些无效数据。

例如:在一个调查问卷中,询问现在的幸福感,你可以给出两个问题:

你觉得现在的工作满意吗? 不满意|还行|非常满意

你对下份工作充满期待吗? 不期待|一般|非常期待

如果用户填写了「非常满意」,又填写了「非常期待」,这条数据的价值就不大了。

有帮助(4) 未解决问题?