- 1、本文档共5页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
学生学号
实验课成绩
武汉理工大学
学 生 实 验 报 告 书
课 程 名 称 Web数据管理综合设计
开 课 学 院 计算机科学与技术学院
指 导 老 师
学 生 姓 名
专 业 班 级
2013 — 2014 学年 第 一 学期
实验课程名称: Web数据管理综合设计
实验项目名称
词汇检索
实验成绩
实验者
专业班级
组别
同组者
实验日期
11月26日
第一部分:实验分析与设计(可加页)
实验内容描述(问题域描述)
本实验主要是写一个能够完成词汇检索的应用程序。该应用程序可以抓取网页中内容或者读取本地文件中的内容,将内容作为程序的库。并与用户输入的关键字进行匹配,输出含有输入关键字的文件名。
实验要求:编程语言不限。
实验基本原理与设计(包括实验方案设计,实验手段的确定,试验步骤等,用硬件逻辑或者算法描述)
本程序使用java编程语言实现,主要用到的数据结构为MapKey,Value。
实验方案设计
(1)新建三个txt文档作为检索内容。(便于在不联网的机器上使用)
(2)新建工程并完成文件的读取工作。
(3)设计算法完成词汇的检索功能。本实验主要使用了hashMap函数实现关键字和文件名的映射。文件名的集合主要使用的是set接口。
实验基本步骤
(1)文件名的读取
实验的txt文档的读取主要是将所有的文件名组成一个list表,然后读取list中后缀名为txt的文件名,并存储在fileList中。
File file = new File(.);
String[] filename = file.list();
ListFile filelist = new LinkedListFile();
for (int i = 0; i filename.length; i++) {
if (filename[i].endsWith(.txt)) {
filelist.add(new File(filename[i]));
}
}
(2)文件内容的读取和检索
主要完成文档内容的读取并将不同的单词放到set集合中,建立单词和文档
的映射。这里使用hashMap完成映射工作,使用set来集合同一个单词存在的文件名称。这里使用的set接口而不不是list接口主要是因为list接口的元素以线性方式存储,集合中可以存放重复对象。所以需要完成去重工作。而set接口的add方法自动完成这样的功能。
HashMapString,SetString hash =
new HashMapString,SetString();
for(int i = 0 ;i filelist.size(); i++){
String[] fileword = ReadFile(filelist.get(i));
for(String string:fileword){
if(hash.containsKey(string)){
SetString set = new HashSetString();
set.addAll(hash.get(string));
set.add(filelist.get(i).getName());
hash.put(string, set);
}
else{
SetString set = new HashSetString();
set.add(filelist.get(i).getName());
hash.put(string, set);
}
for (Map.EntryString, SetString entry : hash.entrySet()) {
System.out.println(entry.getKey() + : + entry.getValue());
}
}
}
主要仪器设备及耗材
PC机
JDK
Myeclipse
第二部分:实验调试与结果分析(可加页)
调试过程(包括调试方法描述、实验数据记录,实验现象记录,实验过程发现的问题等)
本实验主要实现对文档中单词读取并且检索。实现单词与包含单词的文档的映射,完成单词检索功能。
该实验实现使用hashMapString, ListString实现映射的。后发现L
文档评论(0)