“Ir-2019-spring”的版本间的差异
跳到导航
跳到搜索
| 第50行: | 第50行: | ||
* 2019.3.19 | * 2019.3.19 | ||
| − | * 课件 [http://hlt.suda.edu.cn/yingli/teach/ir-2019-spring/web-page-content-extraction.ppt PPT下载] | + | * 课件 |
| − | * 数据下载 [http://hlt.suda.edu.cn/yingli/teach/ir-2019-spring/1.html 1.html] [http://hlt.suda.edu.cn/yingli/teach/ir-2019-spring/2.html 2.html] | + | ** [http://hlt.suda.edu.cn/yingli/teach/ir-2019-spring/web-page-content-extraction.ppt PPT下载] |
| + | ** [http://hlt.suda.edu.cn/yingli/teach/ir-2019-spring/web-page-content-extraction.pdf PDF下载] | ||
| + | * 数据下载 | ||
| + | **[http://hlt.suda.edu.cn/yingli/teach/ir-2019-spring/1.html 1.html] | ||
| + | **[http://hlt.suda.edu.cn/yingli/teach/ir-2019-spring/2.html 2.html] | ||
= 作业 2:单词计数 = | = 作业 2:单词计数 = | ||
2019年3月19日 (二) 05:06的版本
信息检索课程设计(Information Retrieval)Course Resources
Teacher: 李正华
Teach Assistant:
2019春季学期 周二5-8节 理工楼247和238
计算成绩的规则和说明
- 实验作业:70-80分
- 一系列作业,每个作业10-20分
- 必须按照规定时间将实验报告+源代码,提交到csteaching
- 期末面对面小测验:10分(待定)
- 考察课程相关的基础知识,看看作业是否是自己做的
- 平时成绩:10-20分
- 不能迟到、早退,特殊情况必须请假,并带辅导员签字的假条;
- 点名时,如果发现名单上没有你的名字,及时提出
提交作业说明
- 网址:csteaching
- 在规定时间内提交作业,包含两部分
- 实验报告(word或pdf)
- 认真填写个人信息、实验题目、实验内容等
- 不要大段粘贴代码,最多可以粘贴核心的一小段代码
- 写清楚自己的解决思路,尤其是遇到的难点和如何解决
- 建议可以画流程图或者写伪代码
- 将程序运行结果截图
- 附件(.zip压缩包)
- 源代码
- readme.txt文件:说明如何运行你的程序,需要什么环境,如windows或linux,python版本如python3.5
- 实验报告(word或pdf)
- 提交前自我检查
- 是否有包含readme.txt文件解释如何编译执行你的程序。如没有该文件,将减分
- 是否认真完成实验报告
- 是否可以按照readme.txt正确编译和运行程序
- 是否包含别人的代码
- 期末可能会用软件做自动抄袭检查
实验报告word模板
信息检索课程介绍
作业 3:网页正文抽取
作业 2:单词计数
作业 1:最大匹配分词
- 2019.3.5
- 2019.3.19上机课前提交
- 课件:前向最大匹配 PDF文件--文件:Word-seg-max-match.pdf;PPT文件--文件:Word-seg-max-match.zip
- 数据下载:
- 字典:文件:Dict.txt
- 待分词:文件:Sentence.txt
- 正确答案:文件:Answer.txt;
- 模型预测结果:文件:Out.txt
- 正确实验结果
- 正确识别的词数:20263
- 识别出的总体个数:20397
- 测试集中的总体个数:20454
- 正确率:0.99343
- 召回率:0.99066
- F值:0.99204