首页> 中国专利> 基于区块链的二手房数据分析方法及系统

基于区块链的二手房数据分析方法及系统

摘要

本发明公开了一种基于区块链的二手房数据分析方法及系统。一种基于区块链的二手房数据分析方法,包括:步骤一:建立关键词分类数据库;步骤二:对文本使用分词技术将其分为关键词;步骤三:使用TF‑IDF模型进行信息检索;步骤四:对关键词利用聚类算法进行聚类,对二手房信息进行分类,或者采用分词技术去碰撞分类数据库,并归属到相应的二手房分类。本发明对消费者、房地产中介和政府来说,对二手房数据的分析研究来帮助他们完成自己的决策是很必要的。

著录项

  • 公开/公告号CN112633915A

    专利类型发明专利

  • 公开/公告日2021-04-09

    原文格式PDF

  • 申请/专利权人 苏州黑云智能科技有限公司;

    申请/专利号CN202011429024.0

  • 发明设计人 王治东;谢绍韫;

    申请日2020-12-09

  • 分类号G06Q30/02(20120101);G06Q50/16(20120101);G06F21/64(20130101);G06F16/35(20190101);G06F16/335(20190101);G06F16/31(20190101);G06K9/62(20060101);

  • 代理机构32257 苏州市中南伟业知识产权代理事务所(普通合伙);

  • 代理人郭磊

  • 地址 215000 江苏省苏州市工业园区东环路378号2幢228室

  • 入库时间 2023-06-19 10:32:14

说明书

技术领域

本发明涉及二手房数据分析领域,具体涉及一种基于区块链的二手房数据分析方法及系统。

背景技术

近年来随着社会经济的快速发展,房地产交易越发频繁尤其是二手房交易,为了及时了解房屋信息的波动,房屋数据分析系统应运而生。目前房屋分析领域的系统功能主要集中在实现系统的房屋数据综合分析和关联分析,比如对房屋交易信息进行单位面积房价、地点等关键信息提取以及对特定房价、特定区域等在内的同房型或不同房型的信息进行关联分析;未来的二手房房价发展趋势、二手房的地理分布以及结合区块链技术尚未实现。对于消费者、房地产中介和政府来说,对二手房数据的分析研究来帮助他们完成自己的决策是很必要的。

现有的二手房数据分析方法及系统,是根据现有的二手房屋交易网站对交易信息进行收集、分析。

目前现有方法及系统在功能上缺少对二手房的分类和二手房交易的地理分布,没有对二手房的分类,用户在使用的时候对交易信息的查找会造成困难,而二手房交易地理分布则可以提高对二手房交易的监控。在存储上现有的数据保护性私密性差,并不能安全的共享数据,区块链的数据脱敏技术可以保证数据私密性,为隐私下的数据提供了解决方案。

发明内容

本发明要解决的技术问题是提供一种基于区块链的二手房数据分析方法及系统。

为了解决上述技术问题,本发明提供了一种基于区块链的二手房数据分析方法,包括:

步骤一:建立关键词分类数据库;

步骤二:对文本使用分词技术将其分为关键词;

步骤三:使用TF-IDF模型进行信息检索;

步骤四:对关键词利用聚类算法进行聚类,对二手房信息进行分类,或者采用分词技术去碰撞分类数据库,并归属到相应的二手房分类;

步骤五:然后再对二手房交易信息进行分析处理,所述分析处理包括:单位面积房价分析、区域房屋信息分析、房屋楼层分析、房屋配置分析和房屋周围设施分析;

步骤六:根据二手房交易的地理分布进行划分,对同样的房屋交易信息进行分析,并根据已有的房屋交易趋势预测房屋交易的可能方向和结果;

步骤七:最后将二手房的所有信息存储在区块链中。

在其中一个实施例中,所述关键词分类数据库包括居家生活类关键词数据库、出行度假类关键词数据库、交通便利类关键词数据库和优质教育类关键词数据库。

在其中一个实施例中,“使用TF-IDF模型进行信息检索”具体包括:定义需要去除的词语列表,使用sklearn提供的函数即feature_extraction.text下的TfidfVectorizer函数创建词语转向量的对象,使用fit_transform函数将关键字转换为词向量空间模型。

在其中一个实施例中,所述聚类算法采用kmeans聚类算法。

在其中一个实施例中,所述分词技术是httpcws分词方法。

基于同样的发明构思,本申请还提供一种基于区块链的二手房数据分析系统,包括网络爬虫模块、房屋数据分析模块和区块链存储模块;

所述网络爬虫系统用于提取互联网中的房屋交易信息,提供所需数据,并定时进行更新;

所述房屋数据分析模块包括:房屋数据分析模块、房屋交易分布模块和房价预测模块;

所述房屋数据分析模块基于区块链构建房屋交易数据库;所述房屋交易分布模块用于对不用区域的二手房交易数据进行处理生成相应的分布图,按二手房的交易数量统计划分为:一级、二级、三级,可以根据输入的地名提供当地的二手房交易数据。所述房价预测模块通过建立的二手房房价预测模型对相应的二手房交易信息进行预测分析,根据已有的信息预测二手房房屋交易的大致价格的方向和结果;

所述区块链存储模块用于存储房屋交易信息。

在其中一个实施例中,所述房屋数据分析模块包括二手房单位面积房价分析模块、区域范围内二手房信息分析模块和二手房分类关键词模块;

所述二手房单位面积房价分析模块是利用变量直方图来观察数据的合理性,查看房价的均值、中位数、标准差基本数值;所述区域范围内二手房信息分析模块是对各区的房屋信息数量情况进行比较、各个房屋房价的比较、对二手房房屋结构对房价的影响分析以及房屋地理位置对房价的影响;所述二手房分类关键词模块通过一个相同意思不同叫法的关键词映射词库,对爬取的二手房交易数据统计出词频图谱以及词云图。

基于同样的发明构思,本申请还提供一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现任一项所述方法的步骤。

基于同样的发明构思,本申请还提供一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现任一项所述方法的步骤。

基于同样的发明构思,本申请还提供一种处理器,所述处理器用于运行程序,其中,所述程序运行时执行任一项所述的方法。

本发明的有益效果:

对消费者、房地产中介和政府来说,对二手房数据的分析研究来帮助他们完成自己的决策是很必要的。

附图说明

图1是本发明基于区块链的二手房数据分析方法的流程示意图。

图2是本发明基于区块链的二手房数据分析系统的结构示意图。

具体实施方式

下面结合附图和具体实施例对本发明作进一步说明,以使本领域的技术人员可以更好地理解本发明并能予以实施,但所举实施例不作为对本发明的限定。

参阅图1,一种基于区块链的二手房数据分析方法,包括:

步骤一:建立关键词分类数据库。

具体地,所述关键词分类数据库包括居家生活类关键词数据库、出行度假类关键词数据库、交通便利类关键词数据库和优质教育类关键词数据库。

比如,出现“生活超市”,“农贸市场”,“生活广场”等可以归属到居家生活类关键词数据库。

比如,出现“公园”,“风景区”等可以归属到出行度假类关键词数据库。

比如,出现“地铁”,“公交”等可以归属到交通便利类关键词数据库。

比如,出现“学校”可以归属到优质教育类关键词数据库。

步骤二:对文本使用分词技术将其分为关键词。

步骤三:使用TF-IDF模型进行信息检索。

在其中一个实施例中,“使用TF-IDF模型进行信息检索”具体包括:定义需要去除的词语列表,使用sklearn提供的函数即feature_extraction.text下的TfidfVectorizer函数创建词语转向量的对象,使用fit_transform函数将关键字转换为词向量空间模型。

步骤四:对关键词利用聚类算法进行聚类,对二手房信息进行分类,或者采用分词技术去碰撞分类数据库,并归属到相应的二手房分类。

具体地,所述聚类算法采用kmeans聚类算法。当然,也可以根据需要采用其他聚类算法。

步骤五:然后再对二手房交易信息进行分析处理,所述分析处理包括:单位面积房价分析、区域房屋信息分析、房屋楼层分析、房屋配置分析和房屋周围设施分析。

步骤六:根据二手房交易的地理分布进行划分,对同样的房屋交易信息进行分析,并根据已有的房屋交易趋势预测房屋交易的可能方向和结果。

步骤七:最后将二手房的所有信息存储在区块链中。

具体地,所述分词技术是httpcws分词方法。当然,也可以根据需要采用其他分词方法。

参阅图2,一种基于区块链的二手房数据分析系统,包括网络爬虫模块、房屋数据分析模块和区块链存储模块;

所述网络爬虫系统用于提取互联网中的房屋交易信息,提供所需数据,并定时进行更新;

所述房屋数据分析模块包括:房屋数据分析模块、房屋交易分布模块和房价预测模块;

所述房屋数据分析模块基于区块链构建房屋交易数据库;所述房屋交易分布模块用于对不用区域的二手房交易数据进行处理生成相应的分布图,按二手房的交易数量统计划分为:一级、二级、三级,可以根据输入的地名提供当地的二手房交易数据。所述房价预测模块通过建立的二手房房价预测模型对相应的二手房交易信息进行预测分析,根据已有的信息预测二手房房屋交易的大致价格的方向和结果;

所述区块链存储模块用于存储房屋交易信息。

具体地,所述房屋数据分析模块包括二手房单位面积房价分析模块、区域范围内二手房信息分析模块和二手房分类关键词模块;

所述二手房单位面积房价分析模块是利用变量直方图来观察数据的合理性,查看房价的均值、中位数、标准差基本数值;所述区域范围内二手房信息分析模块是对各区的房屋信息数量情况进行比较、各个房屋房价的比较、对二手房房屋结构对房价的影响分析以及房屋地理位置对房价的影响;所述二手房分类关键词模块通过一个相同意思不同叫法的关键词映射词库,对爬取的二手房交易数据统计出词频图谱以及词云图。

区块链存储是指用区块链构建的去中心化存储系统,是区块链和存储系统的有效结合。从本质上讲,它是一个共享数据库,存储于其中的数据或信息,具有“不可伪造”“全程留痕”、“可以追溯”、“公开透明”、“集体维护”等特征。基于这些特征,区块链技术奠定了坚实的“信任”基础,创造了可靠的“合作”机制。存储在区块链上的信息是公开的,但是账户身份信息是高度加密的,只有在数据拥有者授权的情况下才能访问到,从而保证了数据的安全和个人的隐私。区块链的技术安全度高,技术前景广阔,目前还在不断的发展,就现在而言在处理分析数据时,已经能够很好的保护个人和企业的隐私。

基于同样的发明构思,本申请还提供一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现任一项所述方法的步骤。

基于同样的发明构思,本申请还提供一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现任一项所述方法的步骤。

基于同样的发明构思,本申请还提供一种处理器,所述处理器用于运行程序,其中,所述程序运行时执行任一项所述的方法。

对消费者、房地产中介和政府来说,对二手房数据的分析研究来帮助他们完成自己的决策是很必要的。

以上所述实施例仅是为充分说明本发明而所举的较佳的实施例,本发明的保护范围不限于此。本技术领域的技术人员在本发明基础上所作的等同替代或变换,均在本发明的保护范围之内。本发明的保护范围以权利要求书为准。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号