首页> 中国专利> 对返回路径数据的神经网络处理以估计家庭人口统计

对返回路径数据的神经网络处理以估计家庭人口统计

页面导航

摘要
著录项
说明书
相似文献

摘要

公开了实现对机顶盒返回路径数据的神经网络处理以估计家庭人口统计的示例方法、设备、系统以及制品(例如，物理存储介质)。本文所公开的示例人口统计估计系统包括特征生成器，其根据从与返回路径数据家庭关联的机顶盒报告的返回路径数据来生成特征。所公开的示例人口统计估计系统还包括神经网络，其对根据返回路径数据生成的特征进行处理，以预测返回路径数据家庭的人口统计分类概率，该神经网络要基于从仪表报告的小组数据来进行训练，该仪表对与小组成员家庭关联的媒体装置进行监测。所公开的示例人口统计估计系统还包括人口统计指派引擎，其基于所预测的人口统计分类概率，向所述返回路径数据家庭中的相应返回路径数据家庭指派一个或更多个人口统计类别。

著录项

公开/公告号CN113196300A

专利类型发明专利
公开/公告日2021-07-30

原文格式PDF
申请/专利权人尼尔森(美国)有限公司;
展开▼

申请/专利号CN201980079134.8
发明设计人 J·沙利文;J·I·弗里德曼;E·布朗;P·奇门蒂;J·G·兰诺斯;L·德门;F·布尔顿;
展开▼

申请日2019-10-08
分类号G06N3/04(20060101);G06N3/08(20060101);G06N7/00(20060101);
代理机构11127 北京三友知识产权代理有限公司;
代理人韩中领;王小东
地址美国纽约州
入库时间 2023-06-19 12:02:28

说明书

相关申请

本申请要求题为“NEURAL NETWORK PROCESSING OF SET-TOP BOX RETURN PATHDATA TO ESTIMATE HOUSEHOLD DEMOGRAPHICS”并于2018年10月10日提交的美国临时申请系列号No.62/743,925的权益和优先权。美国临时申请系列号No.62/743,925的全部内容通过引用而并入于此。

技术领域

本公开总体上涉及神经网络(neural network)，更特别地，涉及对返回路径数据的神经网络处理以估计家庭人口统计(estimate household demographics)。

背景技术

诸如尼尔森公司(美国)LLC这样的受众测量实体(AME：Audience measuremententity)可以根据相对少量的小组家庭(panel home)样本来外推总体电视观众的收视率(rating)指标和/或其它受众测量数据。小组家庭可能经过了深入研究并且通常被选为代表整个受众全体(audience universe)。而且，为帮助补充小组数据，诸如尼尔森公司(美国)LLC这样的AME可能会与付费电视提供商公司达成协议，以获得从机顶盒和/或其它装置/软件得到的电视调谐信息，这在本文中并且在行业中被称为返回路径数据。

附图说明

图1是根据本公开的教导的使用神经网络根据机顶盒返回路径数据来估计人口统计分类概率的示例处理流程的框图。

图2是根据本公开的教导的使用由图1的示例处理流程所估计的人口统计分类概率来向家庭指派人口统计的示例处理流程的框图。

图3是根据本公开的教导的被构造成实现图1和图2的处理流程以根据机顶盒返回路径数据来估计家庭人口统计的示例基于神经网络的人口统计估计系统的框图。

图4A至图4B例示了由被包括在图3的示例基于神经网络的人口统计估计系统中的示例特征生成器所生成的示例特征。

图5是被包括在图3的示例基于神经网络的人口统计估计系统中的示例人口统计预测神经网络的示例实现的框图。

图6A至图6C例示了根据本公开的教导的图3的人口统计预测神经网络的示例操作，以根据机顶盒返回路径数据来估计人口统计分类概率。

图7例示了用于实现被包括在图3的示例基于神经网络的人口统计估计系统中的示例家庭人口统计指派引擎的示例伪代码。

图8A至图8E例示了根据本公开的教导的图3的家庭人口统计指派引擎的示例操作，以向家庭指派人口统计。

图9A至图9C例示了可以由图3的家庭人口统计指派引擎执行的示例模拟退火操作。

图10是表示可以被执行以实现图3的基于神经网络的人口统计估计系统的示例机器可读指令的流程图。

图11是被构造成执行图10的示例机器可读指令以实现图3的示例基于神经网络的人口统计估计系统的示例处理器平台的框图。

这些图不是按比例绘制的。一般来说，贯穿附图和所附书面描述使用相同的标号来指代相同或相似的部分、要素等。

具体实施方式

本文公开了实现对返回路径数据的神经网络处理以估计家庭人口统计的示例方法、设备、系统以及制品(例如，物理存储介质)。本文所公开的这种人口统计估计系统的示例包括特征生成器，该特征生成器根据从与返回路径数据家庭关联的机顶盒报告的返回路径数据来生成特征。本文所公开的示例人口统计估计系统还包括神经网络，该神经网络对根据返回路径数据生成的特征进行处理，以预测返回路径数据家庭的人口统计分类概率。本文所公开的示例人口统计估计系统还包括人口统计指派引擎(demographic assignmentengine)，该人口统计指派引擎基于所预测的人口统计分类概率，向所述返回路径数据家庭中的相应返回路径数据家庭指派一个或更多个人口统计类别。

下面，进一步详细地公开了实现对返回路径数据的神经网络处理以估计家庭人口统计的这些和其它示例方法、设备、系统以及制品(例如，物理存储介质)。

如上所提到的，AME根据相对少量的小组成员家庭(panelist household)(本文中也被称为小组家庭)样本外推总体电视观众的收视率指标和/或其它受众数据。小组家庭可能经过了深入研究并且通常被选为代表整个受众全体(audience universe)。然而，利用少量的小组家庭来准确地表示总受众群体中存在的地理分布和人口统计多样性仍然是一个挑战。将有关媒体接触(media exposure)的附加信息流并入总受众群体中可以填补任何统计样本所固有的空白或偏见。

为了帮助补充小组数据，诸如尼尔森公司(美国)LLC这样的AME可能会与付费电视提供商公司达成协议，以获得从机顶盒得到的电视调谐信息，这在本文中并且在行业中被称为返回路径数据(RPD：return path data)。机顶盒(STB：Set-top box)数据包括由机顶盒收集的所有数据。STB数据例如可以包括调谐事件和/或由STB接收到的命令(例如，通电、断电、改变频道、改变输入源、开始呈现媒体、暂停媒体呈现、录制媒体呈现、调高/调低音量等)。另外或者另选地，STB数据可以包括由STB发送给内容提供商的命令(例如，开关输入源、录制媒体呈现、删除录制的媒体呈现、媒体呈现开始的时间/日期、媒体呈现的完成时间等)、心跳信号等。另外或者另选地，机顶盒数据可以包括家庭标识(例如，家庭ID)和/或STB标识(例如，STB ID)。

返回路径数据包括可经由从媒体消费者地点到服务提供商的返回路径在媒体服务提供商(举例来说，诸如有线电视服务提供商、卫星电视服务提供商、流传输媒体服务提供商、内容提供商等)处接收的任何数据。这样，返回路径数据包括机顶盒数据的至少一部分。另外或者另选地，返回路径数据可以包括来自具有网络访问能力的任何其它消费者装置的数据(例如，经由蜂窝网络、互联网、其它公共或专用网络等)。例如，返回路径数据可以包括来自STB的线性实时数据、来自引导服务器的引导用户数据、点击流数据、键数据(例如，对遥控器的任何点击——音量、静音等)、交互式活动(诸如视频点播)以及任何其它数据(例如，来自中间件的数据)中的任一者或全部。另外或者另选地，RPD数据可以来自网络(例如，经由交换数字软件)和/或来自云的任何基于云的数据(诸如远程服务器DVR)。

RPD可以洞悉与更大部分(segment)的受众群体关联的媒体接触。这是因为与AME的小组家庭中包括的家庭相比，RPD通常会为更大量的家庭提供丰富的电视观看信息流。然而，与经过深入研究的AME小组家庭不同，付费电视订户的人口统计详细信息通常是未知的。在RPD中缺少这种人口统计详细信息会导致以下技术问题：阻止或者至少限制了有效地使用RPD来补充AME的小组数据的能力，这是因为监测各种受众人口统计的行为概况需要了解提供RPD的订户家庭的人口统计组成。

如本文所公开的对机顶盒RPD的神经网络处理以估计家庭人口统计提供了针对将RPD与小组数据相组合以进行受众测量的技术问题的技术解决方案。如下面进一步详细讨论的，根据本公开的教导实现的示例基于神经网络的人口统计估计系统使用从受监测的AME小组家庭收集的小组数据作为训练集，以用于将神经网络(例如，递归神经网络)训练成能够根据描述历史电视调谐行为的RPD调谐数据，来预测与报告RPD数据的RPD家庭中的相应RPD家庭关联的不同家庭人口统计特征的概率。然后，所公开的示例基于神经网络的人口统计估计系统预测使用不同家庭人口统计特征的预测概率来向家庭指派人口统计组成。这样，示例基于神经网络的人口统计估计系统将人口统计组成指派给提供RPD的订户家庭，从而允许RPD与驱动AME的受众测量系统的小组数据相组合或者以其它方式增强所述小组数据。

转至附图，图1例示了根据本公开的教导的使用神经网络根据机顶盒RPD来估计人口统计分类概率的示例处理流程100的框图。示例处理流程100包括：示例数据收集阶段105、示例特征生成阶段110、以及示例神经网络人口统计概率预测阶段115。示例处理流程100还被分成示例神经网络训练分支120和示例神经网络应用分支125。

在神经网络训练分支120的数据收集阶段105中，示例小组成员调谐数据130是从对由AME招募的小组家庭中的媒体接触进行监测的仪表收集的。小组成员调谐数据130可以包括可由仪表收集的任何数据，诸如但不限于，标识由小组家庭中的媒体装置呈现的媒体的数据、标识小组家庭中的小组成员的特征的人口统计数据等。在神经网络训练分支120的特征生成阶段110中，示例特征135是根据所收集的小组成员调谐数据130生成的，并且被设置成形成特征向量，如下面进一步详细描述的。在神经网络训练分支120的神经网络人口统计概率预测阶段115中，对神经网络进行训练可以根据从所收集的小组成员调谐数据130生成的特征135，来预测与不同小组家庭关联的不同家庭人口统计特征的概率，如下面进一步详细描述的。

在神经网络应用分支125的数据收集阶段105中，示例RPD调谐数据145是从一个或更多个付费电视提供商(例如，有线电视服务提供商、卫星电视服务提供商、流传输媒体服务提供商、内容提供商等)的机顶盒收集的。机顶盒还可以是指可以从中收集RPD调谐数据145的任何解码器、接收器、集成的接收器-解码器(IRD)、媒体装置等。在神经网络应用分支125的特征生成阶段110中，示例特征150是根据所收集的RPD调谐数据145生成的，并且被设置成形成特征向量，如下面进一步详细描述的。在神经网络应用分支125的神经网络人口统计概率预测阶段115中，将经训练的神经网络应用于根据所收集的RPD调谐数据145生成的特征150，以预测与报告RPD调谐数据145的不同RPD订户家庭关联的不同家庭人口统计特征的示例估计概率160，如下面进一步详细描述的。

图2例示了根据本公开的教导的使用由图1的示例处理流程100所预测的估计人口统计分类概率160来向家庭指派人口统计的示例处理流程200的框图。如下面进一步详细讨论的，处理流程200利用示例混合整数编程解决方案205，该解决方案基于由示例处理流程100所预测的估计人口统计分类概率160来解决约束优化问题，举个例子，提供RPD调谐数据145的订户家庭的估计人口统计组成210。

图3例示了根据本公开的教导的被构造成分别实现图1和图2的处理流程100和200以根据机顶盒RPD来估计家庭人口统计的示例基于神经网络的人口统计估计系统300的框图。示例基于神经网络的人口统计估计系统300包括：示例网络接口305、示例小组调谐数据收集器310、示例小组成员数据库315、示例RPD数据收集器320、示例RPD数据库325、示例特征生成器330、示例人口统计预测神经网络335、示例家庭人口统计指派引擎340、示例约束数据库345以及示例收视率计算器350。

在例示示例中，小组调谐数据收集器310经由与一个或更多个示例网络355通信的网络接口305，收集来自示例仪表355A至355B的小组成员调谐数据130，这些示例仪表对与由AME招募的小组家庭中的示例媒体装置360A至360B(例如，电视、收音机、计算机、平板装置、智能电话等)关联的媒体接触进行监测。小组调谐数据收集器310将所收集的小组成员调谐数据130存储在小组成员数据库315中。在例示示例中，RPD数据收集器320经由与所述一个或更多个网络355通信的网络接口305，收集来自一个或更多个示例服务提供商370的RPD调谐数据145，这些服务提供商从订户家庭中的示例单独STB 375收集RPD调谐数据145。另外或者另选地，在一些示例中，RPD数据收集器320直接经由与所述一个或更多个网络355通信的网络接口305，收集来自订户家庭中的单独STB 375中一个或更多个STB的RPD调谐数据145。RPD数据收集器320将所收集的RPD调谐数据145存储在RPD数据库325中。

例示的示例特征生成器330生成由示例人口统计预测神经网络335所使用的特征和特征向量。在一些示例中，RPD调谐数据是由相应机顶盒何时被调谐至不同电台的顺序日志组成的。在连续的电视观看会话过程中，个人(例如，受众成员)在多个网络之间转换，并且这种活动模式可以单独地提供超出调谐记录的有关家庭的附加信息。为了捕获该行为，特征生成器330将电视调谐的STB记录编译成“视块(view block)”，这些“视块”将一个或更多个未知观看者的观看行为汇总成固定数量的特征，以概括各个连续的观看会话。在一些示例中，视块持续时间以1小时或者某一其它持续时间为上限，以考虑到多个观看者可以控制电视而不必在会话之间关闭电视的情形情况。在例示示例中，各个视块皆包含F个特征，这些特征记录有关视块的开始时间、频道点击率、观看会话的持续时间以及会话期间访问的电视台的列表的信息。

图4A至图4B例示了特征生成器330的示例操作，以将来自RPD调节数据145的示例RPD调节数据记录405组合到相应示例视块410和415中。在图4A的例示示例中，数据记录405中的相应数据记录记录了由STB 375所报告的调谐事件。给定的数据记录405指定标识与事件日志对应的STB的STB标识符(STB ID)420、分别对应于由事件日志所表示的调谐事件的开始时间425和结束时间430、标识与调谐事件关联的媒体源的源标识符(SID)435(例如，频道号、电台标识符等)以及标识与调谐事件关联的媒体最初何时播送的广播时间440(例如，以区分实况和时移调谐事件)。在图4B的例示示例中，视块410汇总被记录在给定家庭的数据记录405中的以下调谐事件：该调谐事件发生于自2016年11月5日上午8:23开始的小时间隔中。在图4B的例示示例中，视块415汇总被记录在给定家庭的数据记录405中的以下调谐事件：该调谐事件发生于自2016年11月6日下午6:04开始的小时间隔中。

例示的示例特征生成器330按家庭将视块分组，并且将一组N个视块组装成二维(N×F)矩阵，该二维矩阵包含由家庭在给定观察时段内生成的视块的记录。在一些示例中，特征生成器330将相关的家庭级特征(包括电视调谐器的数量，以及所收看电视的量)与该视块数据汇总成各个家庭的H维(1×H)附加特征向量。

在一些示例中，各个视块皆为描述对应电视观看会话的(1×173)特征向量。这样，对于该示例，对应的(N×F)矩阵的F维为173。表1例示了被表示为(1×173)特征向量的示例视块的内容。

表1

表1中的前三个特征是不言自明的。表1中的“频道改变率”特征是频道在视块期间改变的次数与视块的持续时间(以分钟为单位)的比率。“观看各个网络的分钟数”特征是收看各个电视台的总分钟数。在表1的示例中，视块的持续时间上限为60分钟，因此，所有网络上这些特征的总和要<＝60.0分钟。在一些这样的示例中，因此，可以将观看会话与一个或更多个视块关联。在表1的示例中，各个电台皆被随机地指派了介于4到173之间的索引值。

在一些示例中，包含少于5分钟的电视观看行为的视块(来自小组家庭)不会被用于训练人口统计预测神经网络335。然后，将各个家庭(例如，用于神经网络训练的小组家庭以及用于神经网络应用的RPD家庭)的视块堆叠成例如具有400行(例如，N＝400)的二维矩阵。在一些示例中，生成少于400个唯一视块的家庭将由特征生成器330进行零填充，直到它们具有400行为止，而具有大于400的那些将被特征生成器330截断至前400行。然后，各个家庭的二维阵列由特征生成器330进行堆叠，以形成一个三维矩阵，该三维矩阵可以被馈入到人口统计预测神经网络335中。

在一些示例中，特征生成器330利用三个家庭级特征H来增大观看数据，这三个家庭级特征H在递归层之后被合并到人口统计预测神经网络335中，如下所述。表2例示了三个家庭级特征H的示例集，这三个家庭级特征对应于(i)在视块所覆盖的不同持续时间(例如，24小时时段)内报告给定家庭的总调谐量(对应于表中的索引0)、(ii)在不同持续时间内报告给定家庭的视块数(对应于表中的索引1)以及(iii)返回路径数据家庭中的第一返回路径数据家庭中包括的总调谐器数(对应于表中的索引2)。

表2

在例示示例中，将人口统计预测神经网络335构造成，预测20个变量(例如，1×20向量)，这些变量表示家庭中存在的不同家庭级人口统计的概率(尽管可以在人口统计预测神经网络335的其它示例实现中另外或者另选地预测表示其它人口统计的其它数量的变量)。在例示示例中，由人口统计预测神经网络335预测的十四个家庭人口统计目标变量指示该家庭中存在14种不同年龄性别组合的相应概率(例如，可能性)，表3中表示了其示例。

表3

除了表3的存在变量之外，在一些示例中，人口统计预测神经网络335还预测了六个附加目标变量，这些附加目标变量描述了户主(HOH)的人口统计概况，表4中表示了其示例。

表4

图5例示了图3的人口统计预测神经网络335的示例实现。在一些示例中，通常，针对正在处理的家庭中的相应家庭(例如，小组和/或RPD家庭)生成的二维(N×F)特征向量(例如，400×173特征向量)是稀疏的(例如，在给定的视块期间，以所述特征向量表示的许多广播网络从未被访问过)。为了将该输入精简成较小的特征子集，人口统计预测神经网络335包括示例时间分布密集层(TDDL)505，该TDDL学习将各个视块映射至输入的精简表示(N×F'，其中F'<

在图5的示例人口统计预测神经网络335中，从合并层515输出的增大特征向量先被传递至一个或更多个附加示例隐藏层520，然后再从示例输出层525输出，作为表示在家庭中存在的C个可能人口统计类别的相应预测概率的(1×C)概率向量。由人口统计预测神经网络335建模的C个人口统计类不必互斥(例如，家庭可能包含多个不同年龄/性别的人)，因此输出向量对未知家庭中存在各个建模的家庭级人口统计的相对概率进行编码。

表5列出了图5的示例人口统计预测神经网络335的各个阶段的数据的示例维。在表5中：N是每家庭的总视块数，F是各个视块中的特征数，F'是由TDDL 505所生成的密集特征的数量，以及H是附加家庭特定特征的数量。

表5

在一些示例中，为了防止人口统计预测神经网络335过度拟合，并且使其能够更好地归纳，在各个训练时期期间，特征生成器330打乱被馈入人口统计预测神经网络335的块的次序。

图6A至图6C例示了人口统计预测神经网络335的示例操作，以在人口统计预测神经网络335已经利用根据小组成员数据130生成的特征向量进行了训练之后，随着将根据RPD调谐数据145生成的特征向量625至635应用于人口统计预测神经网络335，来预测人口统计目标变量605至620。在例示示例中，人口统计预测神经网络335的通过以下项进行训练：(i)根据所报告的小组成员家庭的小组成员调谐数据130来创建视块；(ii)根据所创建的相应小组成员家庭的视块来生成小组成员家庭中的相应小组成员家庭的特征，如上所述；以及(iii)根据对神经网络的内部参数进行调节以减少由神经网络335输出的预测人口统计分类概率160与已知的小组成员家庭的实际人口统计之间的误差的任何训练过程，将小组成员家庭中的相应小组成员家庭的特征应用于神经网络335。如图6A至图6C的示例中所例示的，随着将更多的视块应用于对神经网络335进行训练，网络335的输出将收敛以预测与已知小组成员家庭的实际人口统计相符的人口统计分类概率160。

返回至图3，根据本公开的教导，示例基于神经网络的人口统计估计系统300的示例家庭人口统计指派引擎340使用从人口统计预测神经网络335输出的估计人口统计分类概率(上面也被称为预测人口统计目标变量)来向RPD家庭指派人口统计。图7例示了实现家庭人口统计指派引擎340的示例伪代码700。该示例伪代码700还对应于图2的混合整数编程解决方案205的示例。在图7的例示示例中，给定经受约束集(这些约束具有被存储在示例约束数据库345中的值)的成本矩阵C

如图7的示例所例示的，伪代码700采用任何混合整数编程或类似技术，以通过求解以下经受约束集的目标函数来确定人口统计指派矩阵X

图7的示例约束基于：矩阵X

图8A至图8E例示了由图7的伪代码700实现的家庭人口统计指派引擎340的示例操作，以通过求解经受图7的示例约束的以上表达式，来向RPD家庭指派人口统计类别。图8A例示了示例C

参照图7以及图8A至图8E，图7的示例约束包括第一约束705，该第一约束705指定向所有RPD家庭指派的不同人口统计类别的总和等于相应不同人口统计类别的已知全体估计(UE)(例如，在由变量“slack”表示的容忍水平(tolerance level)内)。图8B例示了第一约束705的示例，其中，针对5个家庭指派的相应人口统计类别的总和等于针对不同人口统计类别的相应示例UE 810(例如，可以从提供RPD的服务提供商获得并存储在约束数据库345中)。例如，在图8B中，第一约束705指定：要被指派人口统计类别“男人”的家庭数等于该人口统计类别的UE为2；要被指派人口统计类别“女人”的家庭数等于该人口统计类别的UE为4；要被指派人口统计类别“女孩”的家庭数等于该人口统计类别的UE为3；以及要被指派人口统计类别“男人”的家庭数等于该人口统计类别的UE为2。

图7的示例约束包括第二约束710，该第二约束710指定必须存在向各个RPD家庭指派的至少一个成人人口统计类别。图8B例示了第二约束710的示例，其中，各个RPD家庭被约束成包括人口统计类别“男人”和/或人口统计类别“女人”(由标号815表示)。

图7的示例约束包括第三约束715，该第三约束715指定向所有RPD家庭指派的不同可能家庭规模的总数量等于该不同可能家庭规模的已知全体估计(UE)(例如，在由变量“slack”表示的容忍水平内)。图8D例示了第三约束715的示例，其中，针对5个家庭指派的相应可能家庭规模的数量等于针对该不同可能家庭规模的相应示例UE 820(例如，可以从提供RPD的服务提供商获得并存储在约束数据库345中)。例如，在图8D中，第三约束715指定：包含两个人的家庭的数量等于该家庭规模的UE为3；包含三个人的家庭的数量等于该家庭规模的UE为1；以及包含四个人的家庭的数量等于该家庭规模的UE为1。

图7的示例约束包括：第四约束720，该第四约束720指定各个RPD家庭要仅仅指派可能的家庭规模中的一个；以及第五约束725，该第五约束725指定向给定RPD家庭指派的不同人口统计类别的数量等于向该家庭指派的家庭规模。图8E例示了由利用图7的伪代码700实现的家庭人口统计指派引擎340以及给定的如图8A至图8D例示的示例约束705至725所确定的最终所得的示例人口统计类别指派825。在图8E的示例中，利用伪代码700实现的家庭人口统计指派引擎340求解经受前述约束的上面(以及图7中)提供的表达式，以指派：(1)第一RPD家庭的“女人”和“男孩”的人口统计类别，(2)第二RPD家庭的“女人”和“男孩”的人口统计类别，(3)第三RPD家庭的“男人”和“女孩”的人口统计类别，(4)第四RPD家庭的“女人”、“女孩”以及“男孩”的人口统计类别，以及(5)第五RPD家庭的“男人”、“女人”、“女孩”以及“男孩”的人口统计类别。如可以在图8A至图8E的示例中看到，人口统计类别指派825满足所指定的约束。

在一些示例中，家庭人口统计指派引擎340实现模拟退火以进一步调节为RPD家庭做出的人口统计类别指派。图9A至图9C例示了家庭人口统计指派引擎340执行模拟退火的示例操作。转至图9A，在例示的示例中，家庭人口统计指派引擎340已经执行了初始的家庭人口统计指派，其中，包含“男孩”和“女孩”两者的人口统计类别指派相对于该人口统计类别组合的UE约束有五个家庭是过多表示的，而包含“男人”和“女孩”两者的人口统计类别指派相对于该人口统计类别组合有五个家庭是表示不足的。如图9B至图9C所示，家庭人口统计指派引擎340可以执行模拟退火，以标识包含被过度表示的“男孩”和“女孩”两者的人口统计类别指派的五个家庭(参见图9B)，并且将“女孩”的人口统计类别指派从那些家庭转移至没有“男人”和“女孩”两者的人口统计类别的五个家庭(参见图9C)。结果是校正了图9A中所例示的过多表示和不足表示的修正人口统计类别指派。

在一些示例中，家庭人口统计指派引擎340将图7所例示的人口统计指派问题分解成几个较小的批处理(batch)，以减少处理和存储器需求。例如，如果市场包含要为其指派人口统计类别的100,000个RPD家庭，那么家庭人口统计指派引擎340可以将指派问题分解成每组1000个家庭的100个组或者每组100个家庭的1000个组等等。在这样的示例中，对图7的伪代码700进行调节，使得与全体估计(UE：universe estimate)有关的约束按批处理组中所包括的RPD家庭数与总RPD家庭数的比率进行缩小，并且将伪代码700应用于为各个批处理组执行人口统计类别指派。然而，由于这种简单的缩放可能不会对所有批处理组产生可求解的约束，因此，包括容忍水平(例如，由图7中的“slack”表示)以增加各个批处理组将具有可求解的人口统计指派的可能性。

返回至图3，基于神经网络的人口统计估计系统300包括收视率计算器350，该收视率计算器350通过使用由家庭人口统计指派引擎340为RPD家庭确定的家庭人口统计指派来确定收视率数据和/或其它受众指标，以利用来自RPD数据库325的RPD调谐数据增大/组合来自小组成员数据库315的小组调谐数据，该小组调谐数据已经具有关联的人口统计数据。

虽然在图3中例示了实现基于神经网络的人口统计估计系统300的示例方式，但是图3所例示的要素、处理和/或装置中的一个或更多个要素、处理和/或装置可以按任何其它方式来进行组合、划分、重新排列、省略、消除和/或实现。此外，示例网络接口305、示例小组调谐数据收集器310、小组成员数据库315、示例RPD数据收集器320、示例RPD数据库325、示例特征生成器330、示例人口统计预测神经网络335、示例家庭人口统计指派引擎340、示例约束数据库345、示例收视率计算器350和/或更一般地图3的示例基于神经网络的人口统计估计系统300可以通过硬件、软件、固件和/或硬件、软件和/或固件的任何组合来实现。因此，例如，示例网络接口305、示例小组调谐数据收集器310、小组成员数据库315、示例RPD数据收集器320、示例RPD数据库325、示例特征生成器330、示例人口统计预测神经网络335、示例家庭人口统计指派引擎340、示例约束数据库345、示例收视率计算器350和/或更一般地示例基于神经网络的人口统计估计系统300中的任一个可以由一个或更多个模拟或数字电路、逻辑电路、可编程处理器、可编程控制器、图形处理单元(GPU：graphics processingunit)、数字信号处理器(DSP：digital signal processor)、专用集成电路(ASIC：application specific integrated circuit)、可编程逻辑装置(PLD：programmablelogic device)、现场可编程门阵列(FPGA：field programmable gate array)和/或现场可编程逻辑装置(FPLD：field programmable logic device)来实现。当将本专利的设备或系统权利要求中的任一项理解成覆盖纯软件和/或固件实现时，示例基于神经网络的人口统计估计系统300、示例网络接口305、示例小组调谐数据收集器310、小组成员数据库315、示例RPD数据收集器320、示例RPD数据库325、示例特征生成器330、示例人口统计预测神经网络335、示例家庭人口统计指派引擎340、示例约束数据库345和/或示例收视率计算器350中的至少一个由此被明确地限定成包括：包括软件和/或固件的非暂时性计算机可读存储装置或存储盘，诸如存储器、数字通用盘(DVD)、光盘(CD)、Blu-ray盘等。更进一步地，示例基于神经网络的人口统计估计系统300除了图3所例示的要素、处理和/或装置以外或者代替图3所例示的要素、处理和/或装置地，还可以包括一个或更多个其它的要素、处理和/或装置，和/或可以包括任何或全部所例示的要素、处理以及装置中的一个以上。如本文所用，短语“在通信中”(包括其变体)涵盖直接通信和/或通过一个或更多个中间组件的间接通信，并且不需要直接的物理(例如，有线)通信和/或持续通信，而是另外包括以周期性间隔、计划的间隔、非周期性间隔和/或一次性事件的选择性通信。

图10示出了表示实现示例基于神经网络的人口统计估计系统300的示例硬件逻辑、机器可读指令、硬件实现的状态机和/或这些的任何组合的流程图。在该示例中，该机器可读指令可以是用于通过计算机处理器(诸如下面结合图11讨论的示例处理器平台1100中示出的处理器1112)执行的一个或更多个可执行程序或者该可执行程序的一部分。可以按存储在非暂时性计算机可读存储介质(诸如CD-ROM、软盘、硬盘驱动器、DVD、Blu-ray盘

如上提及，图10的示例处理可以使用被存储在非暂时性计算机和/或机器可读介质(诸如硬盘驱动器、闪速存储器、只读存储器、光盘、数字通用盘、高速缓冲存储器、随机存取存储器和/或任何其它存储装置或存储盘，其中信息存储长达任何持续时间(例如，用于延长的时段、永久性地、用于简单的实例、用于临时缓冲和/或用于缓存信息))上的可执行指令(例如，计算机和/或机器可读指令)来实现。如本文所用，术语非暂时性计算机可读介质被明确地限定成包括任何类型的计算机可读存储装置和/或存储盘，并且排除传播信号和排除传输介质。而且，如本文所用，除非另有指示，否则术语“计算机可读”和“机器可读”被视为同意义的。

“包括(Including)”和“包含(comprising)”(及其所有形式和时态)在本文中被用作开放式术语。因此，每当权利要求采用任何形式的“包括(Including)”或“包含(comprising)”(例如，comprises、includes、comprising、including、具有(having)等)作为序言或用在任何种类的权利要求陈述内时，要理解成，可以存在附加要素、术语等，而不会落在对应的权利要求或陈述的范围之外。如本文所用，当短语“至少”用作例如权利要求的前序部分中的过渡用语时，其以与用语“包含”和“包括”是开放式相同的方式是开放式的。术语“和/或”当例如以诸如A、B和/或C的形式使用时，是指A、B、C的任何组合或子集，诸如(1)仅A、(2)仅B、(3)仅C、(4)A与B、(5)A与C、(6)B与C以及(7)A与B与C。如本文在描述结构、组件、项目、对象和/或事物的上下文中所用，短语“A和B中的至少一个”旨在指代包括(1)至少一个A、(2)至少一个B以及(3)至少一个A和至少一个B中的任何一个的实现。类似地，如本文在描述结构、组件、项目、对象和/或事物的上下文中所用，短语“A或B中的至少一个”旨在指代包括(1)至少一个A、(2)至少一个B以及(3)至少一个A和至少一个B中的任何一个的实现。如本文在描述处理、指令、动作、活动和/或步骤的实行或执行的上下文中所用，短语“A和B中的至少一个”旨在指代包括(1)至少一个A、(2)至少一个B以及(3)至少一个A和至少一个B中的任何一个的实现。类似地，如本文在描述处理、指令、动作、活动和/或步骤的实行或执行的上下文中所用，短语“A或B中的至少一个”旨在指代包括(1)至少一个A、(2)至少一个B以及(3)至少一个A和至少一个B中的任何一个的实现。

图10所示的流程图表示可以被执行以实现图3的示例基于神经网络的人口统计估计系统300的示例程序1000。参照先前附图以及关联的书面描述，图10的示例程序1000在框1005处开始执行，在该框处，基于神经网络的人口统计估计系统300的示例小组调谐数据收集器310收集小组成员调谐数据，如上所述。在框1010处，基于神经网络的人口统计估计系统300的示例特征生成器330基于所收集的小组成员数据来生成小组成员家庭的特征向量(举例来说，诸如上表1中描述的向量)，如上所述。在框1015处，特征生成器330将在框1010处生成的小组成员特征向量应用于基于神经网络的人口统计估计系统300的示例人口统计预测神经网络335，以对人口统计预测神经网络335进行训练，从而预测相应小组成员家庭的人口统计分类概率，如上所述。

在框1020处，基于神经网络的人口统计估计系统300的示例RPD数据收集器320收集RPD调谐数据，如上所述。在框1025处，示例特征生成器330基于所收集的RPD调谐数据来生成RPD家庭的特征向量(举例来说，诸如上表1中描述的向量)，如上所述。在框1030处，特征生成器330将在框1025处生成的RPD特征向量应用于基于神经网络的人口统计估计系统300的经训练的人口统计预测神经网络335，以预测相应RPD家庭的人口统计分类概率，如上所述。在框1035处，基于神经网络的人口统计估计系统300的示例家庭人口统计指派引擎340使用在框1030处确定的人口统计分类概率，来向RPD家庭中的相应RPD家庭指派人口统计类别，如上所述。在框1045处，基于神经网络的人口统计估计系统300的示例收视率计算器350基于在框1045处向RPD家庭中的相应RPD家庭指派的人口统计类别，利用在框1020处收集的RPD调谐数据，来增大/组合在框1005收集的小组调谐数据，如上所述。

图11是被构造成执行图10的指令以实现图3的示例基于神经网络的人口统计估计系统的示例处理器平台1100的框图。该处理器平台1100例如可以是服务器、个人计算机、工作站、自学习机(例如，神经网络)、移动装置(例如，蜂窝电话、智能手机、诸如iPad

例示的示例处理器平台1100包括处理器1112。例示的示例处理器1112是硬件。例如，可以通过来自任何期望系列或制造方的一个或更多个集成电路、逻辑电路、微处理器、GPU、DSP或控制器实现处理器1112。硬件处理器1112可以是基于半导体(例如，硅基)的装置。在该示例中，处理器1112实现示例小组调谐数据收集器310、示例RPD数据收集器320、示例特征生成器330、示例人口统计预测神经网络335、示例家庭人口统计指派引擎340以及示例收视率计算器350。

例示的示例处理器1112包括本地存储器1113(例如，高速缓冲存储器)。例示的示例处理器1112经由链路1118与包括易失性存储器1114和非易失性存储器1116的主存储器进行通信。链路1118可以通过总线、一个或更多个点对点连接等或者这些的组合来实现。易失性存储器1114可以通过同步动态随机存取存储器(SDRAM：Synchronous Dynamic RandomAccess Memory)、动态随机存取存储器(DRAM：Dynamic Random Access Memory)、

例示的示例处理器平台1100还包括接口电路1120。该接口电路1120可以通过任何类型的接口标准来实现，诸如以太网接口、通用串行总线(USB)、

在例示示例中，将一个或更多个输入装置1122连接至接口电路1120。该输入装置1122准许用户将数据和/或命令输入到处理器1112中。该输入装置例如可以通过音频传感器、麦克风、摄像机(静态或视频)、键盘、按钮、鼠标器、触摸屏、触控板、轨迹球、跟踪条(trackbar)(诸如isopoint)、语音识别系统和/或任何其它人机接口来实现。而且，许多系统(诸如处理器平台1100)可以使得用户能够控制计算机系统并且使用物理姿势(诸如但不限于手或身体移动、面部表情以及面部标识)来向计算机提供数据。

还将一个或更多个输出装置1124连接至例示的示例接口电路1120。该输出装置1124例如可以通过显示装置(例如，发光二极管(LED)、有机发光二极管(OLED)、液晶显示器(LCD)、阴极射线管显示器(CRT)、就地切换(in-place switching(IPS))显示器、触摸屏等)、触觉输出装置、打印机和/或扬声器来实现。例示的示例接口电路1120由此通常包括图形驱动器卡、图形驱动器芯片和/或图形驱动器处理器。

例示的示例接口电路1120还包括通信装置(诸如发送器、接收器、收发器、调制解调器、住宅网关、无线接入点和/或网络接口)，以促进经由网络1126与外部机器(例如，任何种类的计算装置)的数据交换。该通信例如可以是经由以太网连接、数字订户线(DSL)连接、电话线连接、同轴电缆系统、卫星系统、直线对传式无线系统、蜂窝电话系统等的。

例示的示例处理器平台1100还包括用于存储软件和/或数据的一个或更多个大容量存储装置1128。这种大容量存储装置1128的示例包括：软盘驱动器、硬盘驱动器、光盘驱动器、Blu-ray盘驱动器、独立磁盘冗余阵列(RAID)系统以及数字通用盘(DVD)驱动器。在一些示例中，大容量存储装置1128可以实现小组成员数据库315、RPD数据库325和/或约束数据库345。另外或者另选地，在一些示例中，易失性存储器1114可以实现小组成员数据库315、RPD数据库325和/或约束数据库345。

与图10的指令对应的机器可执行指令1132可以存储在大容量存储装置1128中、易失性存储器1114中、非易失性存储器1116中、本地存储器1113中和/或诸如CD或DVD 1136的可去除非暂时性计算机可读存储介质上。

根据前述，应意识到，已经公开了实现对机顶盒返回路径数据的神经网络处理以估计家庭人口统计的示例方法、设备以及制品。上面公开的示例基于神经网络的人口统计估计系统300使用具有时间分布密集层(TDDL：time distributed dense layer)和随后的长期短期记忆(LSTM)递归网络层的神经网络，根据观看数据(例如，用于训练的小组成员调谐数据，以及训练之后的RPD调谐数据)，来预测家庭(例如，用于训练的小组家庭，以及训练之后的RPD家庭)的人口统计分类。示例基于神经网络的人口统计估计系统300将家庭的观看数据分组成描述相应观看会话的视块，其中，视块指示周几、一年的第几天、一天的一刻钟、频道变化率以及观看各个可能网络的分钟数。在一些示例中，观看块的时间上限为60分钟。在一些示例中，通过TDDL组合并处理给定家庭的视块，以生成该家庭的观看会话的精简特征集。然后，通过LSTM处理该精简特征集，以生成概括该家庭的观看历史的精简摘要特征向量。将精简摘要特征向量与附加家庭特征(诸如总TV消费、记录的视块数以及家庭中的TV调谐器数量)进行合并，以生成该家庭的经合并的摘要特征向量。然后，将经合并的摘要特征向量应用于一个或更多个附加隐藏层，这些隐藏层将输出指示该家庭属于不同的可能人口统计类的概率的分类向量。然后，将混合的整数编程用于基于从神经网络输出的人口统计分类概率并且经受一系列约束来求解目标函数，以向提供RPD调谐数据的RPD家庭中的相应RPD家庭指派将一个或更多个人口统计类别。

所公开的方法、设备以及制品通过使RPD调谐数据能够与受众测量处理系统中的小组成员调谐数据相组合来提高使用计算装置的效率。将RPD调谐数据与可用的小组数据组合，可以大大增加受众测量处理系统可用于预测受众指标(例如，收视率)的数据量。这样增加的数据量可以改善输入数据的统计完整性，从而减少受众测量处理系统所生成的结果的关联统计偏差。因此，所公开的方法、设备以及制品致力于计算机功能上的一项或更多项改进。

尽管本文公开了某些示例方法、设备以及制品，但是本专利的覆盖范围不限于此。与此相反，本专利覆盖完全落入本专利的权利要求的范围内的所有方法、设备以及制品。

去获取专利，查看全文>

相似文献

专利
中文文献
外文文献

1. 对返回路径数据的神经网络处理以估计家庭人口统计 [P] . 中国专利： CN113196300A . 2021-07-30
2. 对返回路径数据进行神经网络处理以估计住户成员和访问者人口统计 [P] . 中国专利： CN113785595A . 2021-12-10
3. NEURAL NETWORK PROCESSING OF RETURN PATH DATA TO ESTIMATE HOUSEHOLD DEMOGRAPHICS [P] . 美国专利： US2020117979A1 . 2020-04-16

机译：返回路径数据的神经网络处理以估算家庭人口统计数据
4. NEURAL NETWORK PROCESSING OF RETURN PATH DATA TO ESTIMATE HOUSEHOLD MEMBER AND VISITOR DEMOGRAPHICS [P] . 美国专利： US2020226465A1 . 2020-07-16

机译：返回路径数据的神经网络处理，以估算家庭成员和访客人口统计数据
5. NEURAL NETWORK PROCESSING OF RETURN PATH DATA TO ESTIMATE HOUSEHOLD DEMOGRAPHICS [P] . 世界知识产权组织专利： WO2020076829A1 . 2020-04-16

机译：返回路径数据的神经网络处理以估算家庭人口统计数据