关于数据挖掘:租金多少才算合理智能分析工具Sophon帮你预测房屋租金

46次阅读

共计 3807 个字符,预计需要花费 10 分钟才能阅读完成。

作为一名租客,你是否感觉租的房子品质平平,中介却年年跌价;想换个中央住,在中介找个心仪又价廉的房子犹如海底捞针。而作为一名房东,你是否又遇到过中介左手压价房东、右手跌价租客的状况?本人的房子,多少租出去才最合适?

现在,租房信息大都把握在房产中介手中,房主和租客之间很少造成对接,中介平台能够任意抬升房租价格,以赚取更多两头差价。很多租客对房租市场理解较少,很容易租下房租过高的住房,以致生存成本增加。

克而瑞公布的《2021 年 1~6 月上海租赁市场月度报告》显示:上半年上海租房市场租金整体呈上升状态。局部区域甚至曾经间断上涨了 7 个月。房租上涨成了困扰人们的大问题。为了突破房产中介对房屋信息的垄断,为公众提供租金定价参考。本文将应用最近的房租数据,在智能剖析工具 Sophon 上训练模型,并利用模型进行租金预测。

数据集介绍

本次试验数据集来自爱数科,为 CSV 文件。蕴含 2020 末 -2021 年初来自房天下、58 同城、赶集网的位于北京、上海、深圳约 20000 条数据。除上述网站提供的根本信息,还整合了由百度地图 API 获取的经纬度和周边设施信息。

数据集字段如下:

该数据集价格以外的字段将作为输出,而价格将作为预测指标。由此可见该问题是回归问题。回归问题能够应用线性回归、K 近邻、XGBoost、神经网络、随机森林等算法进行训练。本文将选取随机森林进行训练。

开始试验

在创立我的项目之前,本文默认您的 sophon 平台及各种配置文件曾经胜利装置,失常运行,并且您已胜利注册 sophon 用户。

进入我的项目首页,点击“+ 新建我的项目”以新建一个我的项目。

导入数据与数据摸索

本次试验数据集是 CSV 文件,能够间接导入至 sophon 平台。

点击主界面右边的数据集按钮进入数据集总览界面,在该页面点击“新建数据集”。

在弹出的新建数据集窗口中,点击“从本地导入”。

在数据集导入页面上传本地的 CSV 文件,点击确定创立数据集。

Sophon 也反对其余多种数据源。用户能够通过多种形式导入数据,除了跟 Transwarp Data Hub 做深度对接以外,还反对多种数据源,包含 RDBS、HDFS、ORC、Parquet 等。
数据集创立实现后点击该数据集进入详情界面,能够浏览数据集字段。

同时 Sophon 也提供图形摸索于统计分析性能,点击上方的图形摸索按钮进入对应界面。

Sophon 提供多样图标款式与自定义模块,简略拖动数据集字段即可实现图表,帮忙用户迅速实现数据摸索。图中能够看到数据集大部分屋宇租金都在 50000 以下,面积在 300 以下。还有少部分面积大,租金高的异样点,这些异样数据不利于模型的训练与测试,须要解决。同理查看其余的指标与价格之间的分割,发现其中的异样点,在后续的预处理环节进行解决。

点击上方的统计分析按钮进入对应界面。

在统计分析界面,能够自定义数据集字段,点击剖析后以图表模式给出剖析后果,帮忙用户迅速实现数据摸索。在该数据集中,有许多数据朝向字段为空,须要对数据进行预处理。还有一些字段值为惟一值,在训练前尽量去除这些学习难度大的字段。

搭建算子

回到我的项目首页,点击左侧的试验,点击试验以新建空白试验。试验创立后会主动进入该试验界面。能够看到在左侧算子抉择界面中,咱们曾经能够应用刚刚上传的数据集算子。将该算子拖动到右侧的主流程界面。

拖动算子,搭建预处理过程。

算子搭建实现后,选中算子设置参数。选中替换缺失值算子,参数设置如下。

至此,主流程算子搭建实现,点击运行能够开始训练。

运行试验与查看后果

咱们能够间接点击上方的执行按钮运行试验。运行过程须要一段时间。

运行实现后,能够跳转到试验后果:

在之前性能(回归)算子的参数设置中,本文勾选了均方根误差(RMSE)和 R2_score 两个规范来判断模型的好坏。

R2_score 示意模型拟合数据集的好坏,越靠近 1 示意拟合成果越好。R2_score =0.80 示意模型解释了 80% 的不确定性,模型成果良好。

均方根误差示意模型的偏离水平,越靠近 0 越好。此处 928 的含意就是说 68% 的预测房价值和实在房价之间的差值在 928(元)之间,95% 预测房价值和实在房价之间的差值在 1856(元)之间。

在模型详情中也能够看到该模型的参数重要性,以供参考:

在参数重要性表格中能够看到屋宇面积的重要性最高,紧随其后的是左近医院数量、房间数量、学校数量、最大高度、厅数量等。由此能够晓得这几个参数会对屋宇的租金产生较大影响。

在抉择屋宇时,能够首先依据这几个因素判断屋宇租金是否处于一个正当的范畴。

预测房租与 API 公布

新建一个试验,搭建试验流程,留神应用之前导出的模型算子:

算子的参数设置与上文雷同,不再赘述。点击执行以运行试验。

在后果界面,能够看到模型对租金做出的预测:

试验运行后,点击试验界面左上角的公布按钮进入模型服务页面:

在详情界面填写模型服务的相干信息,留神在给上架的模型设置输出时抉择数据集全副字段,之后点击上架以上架模型服务:

点击左侧的模型服务按钮进入模型服务页面,能够查看刚刚上架的模型服务:

双击该模型来查看详细信息,点击上线进入服务上线页面:

在服务上线页面,能够依据须要调整服务细节,实现后点击上线按钮:

点击左侧工具栏的模型服务按钮进入模型服务界面,点击上方的服务治理按钮进入服务治理页面。在该页面能够看到刚刚上线的服务:

能够点击测试连贯按钮测试连贯状态。如果 API 有返回代表连贯胜利,无返回代表连贯失败。模型刚上线时会显示连贯失败,请稍后再尝试测试连贯。

点击测试按钮能够测试模型,填写对应的信息后点击测试,能够失去 API 的返回后果:

模型 API 调用

感兴趣的用户也能够尝试调用该服务,理论体验一下模型的成果。

API 接口(HTTP):http://tdh5:8743/testV1/api 密钥:Bearer

eyJhbGciOiJIUzUxMiJ9.eyJ1c2VybmFtZSI6Im1rdCIsInJvbGVzIjoiW1wicHVibGljXCIsXCJTT1BIT05fQkFTSUNcIl0iLCJleHAiOjQ3OTA4MDg3MTEsImlhdCI6MTYzNzIwODcxMX0.i08f39Oponyt5TvaWBCo7LLFsmyr-Q5vN0aOMX8p0VkL6N__kcvyvWe1SUfOUNcaiK6GfxbpTpgmRaGWxAZ9hw

基于 Python 的调用示例:

import requestsurl = “http://tdh5:8743/testV1/api”headers = {“Content-Type”: “application/json”, “Authorization”: “Bearer eyJhbGciOiJIUzUxMiJ9.eyJ1c2VybmFtZSI6Im1rdCIsInJvbGVzIjoiW1wicHVibGljXCIsXCJTT1BIT05fQkFTSUNcIl0iLCJleHAiOjQ3OTA4MDg3MTEsImlhdCI6MTYzNzIwODcxMX0.i08f39Oponyt5TvaWBCo7LLFsmyr-Q5vN0aOMX8p0VkL6N__kcvyvWe1SUfOUNcaiK6GfxbpTpgmRaGWxAZ9hw”}data = r”'{“feeds”:{“MHno7-Pfi”:{“columns”:[“website”,”city”,”price”,”room”,”bathroom”,”hall”,”area”,”face”,”height”,”maxheight”,”ownbalcony”,”infopublishertype”,”ownbed”,”ownwardrobe”,”ownsofa”,”owntv”,”ownfridge”,”ownwasher”,”ownaircon”,”ownwaterheater”,”ownbroadband”,”owngas”,”ownheater”,”nearestschooldistance”,”schoolnumber”,”nearesthospitaldistance”,”hospitalnumber”],”rows”:[[“”,””,0,0,0,0,0,””,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0]]}},”macros”:{}}”’response = requests.post(url=url, headers=headers, data=data)print(response.text)

注意事项:1、API 具体的信息输出格局,请参考数据集字段阐明进行输出。2、价格字段的输出不会影响服务的预测值。

对于 Sophon

Sophon 是星环科技的智能剖析工具软件,蕴含 3 个次要模块:Sophon Base,Sophon Edge,Sophon KG。其中 Sophon Base 数据迷信根底平台具备残缺的数据摸索、多数据源接入、试验调度、智能剖析、用户资产以及平台治理等性能;为用户提供残缺的模型上线闭环,全流程图形化帮忙用户更加便捷地对线上服务进行治理,实现模型价值。

如果想要应用 sophon 实际操作,可点击上面的链接 - 进入页面 - 点击立刻申请 - 即可收费取得 7 天应用权限。

星环科技 | TranswarpCloud​cloud.transwarp.cn/mobile/

正文完
 0