1 研究方法和数据来源
1.1 整体思路
1.2 数据集来源
1.3 模型构建
1.3.1 词嵌入的向量表示
1.3.2 基于BERT的分类模型
1.4 模型评估
2 研究结果
2.1 不同维度结果分析
2.1.1 地理分区维度
表1 地理分区维度下测试结果Tab.1 Results based on geographical division |
| 地理分区 | 景区数量/个 | Top1-正确率/% | Top5-正确率/% | 查全率/% | 查准率/% | F1值 | ||||||
|---|---|---|---|---|---|---|---|---|---|---|---|---|
| 均值 | 标准差 | 均值 | 标准差 | |||||||||
| 华北 | 27 | 76.94 | 86.18 | 75.93 | 18.36 | 80.69 | 17.37 | 0.77 | ||||
| 华东 | 80 | 80.61 | 86.25 | 79.37 | 11.59 | 80.29 | 15.51 | 0.79 | ||||
| 华南 | 21 | 76.73 | 88.83 | 74.36 | 12.12 | 77.38 | 16.79 | 0.75 | ||||
| 华中 | 29 | 81.95 | 88.33 | 80.11 | 11.95 | 81.04 | 14.24 | 0.80 | ||||
| 西南 | 39 | 80.15 | 88.86 | 80.28 | 9.71 | 80.38 | 15.71 | 0.79 | ||||
| 东北 | 12 | 76.88 | 82.69 | 75.96 | 11.12 | 84.82 | 12.25 | 0.79 | ||||
| 西北 | 31 | 79.92 | 87.97 | 78.29 | 9.24 | 86.55 | 11.77 | 0.82 | ||||
2.1.2 景区类型维度
表2 景区类型维度下测试结果Tab.2 Results categorized by resource types |
| 景区类型 | 景区数量/个 | Top1-正确率/% | Top5-正确率/% | 查全率/% | 查准率/% | F1值 | ||||||
|---|---|---|---|---|---|---|---|---|---|---|---|---|
| 均值 | 标准差 | 均值 | 标准差 | |||||||||
| 产业融合 | 6 | 79.51 | 82.05 | 73.72 | 9.55 | 81.86 | 10.95 | 0.77 | ||||
| 历史文化 | 102 | 80.98 | 86.99 | 78.62 | 12.25 | 80.90 | 14.82 | 0.79 | ||||
| 现代游乐 | 12 | 79.41 | 85.58 | 75.96 | 14.21 | 81.96 | 18.88 | 0.77 | ||||
| 自然生态 | 119 | 80.19 | 87.78 | 78.83 | 12.24 | 81.40 | 15.85 | 0.79 | ||||
2.2 景区预测效果展示——代表性评论
2.3 评论预测效果验证——模型准确性
2.4 模型应用场景
表3 模型应用场景举例Tab.3 Examples of possible scenarios where the proposed model could be applied |
| 应用场景 | 模型输入 | 模型输出 | ||||
|---|---|---|---|---|---|---|
| 景区编号1 | 景区编号2 | 景区编号3 | 景区编号4 | 景区编号5 | ||
| 体会感受 | “想要享受爬山的乐趣,欣赏祖国大好河山” | 184 | 33 | 92 | 175 | 210 |
| 活动节目 | “希望能进行亲子活动,让孩子在玩中学” | 108 | 75 | 49 | 118 | 184 |
| 主题兴趣 | “我对独特的建筑感兴趣” | 79 | 92 | 153 | 21 | 75 |
| 季节天气 | “我想在冰天雪地里赏雪” | 28 | 49 | 92 | 85 | 21 |
注:模型输出的景区编号按置信度由大到小排列。 |