CAJViewer在学术文献使用中的功能与技巧

2011-04-11 21:50
关键词:工具栏对话框文档

郭 萍

(仙桃职业学院 计科院, 湖北 仙桃 433000)

CAJViewer在学术文献使用中的功能与技巧

郭 萍

(仙桃职业学院 计科院, 湖北 仙桃 433000)

CAJViewer作为一款专门的学术文献浏览软件,兼容多种文献格式,具有浏览页面、查找文字、文本识别、邮件传输等功能。支持PDF的浏览和集成OCR文本识别是该软件的两大亮点,准确及时解决可能出现的问题,灵活使用其功能,可极大地方便用户对学术文献的浏览和使用。

CAJ文件;PDF文件;OCR识别;学术文献

0 引言

CAJViewer支持中国知网的CAJ、KDH、NH、CAA、TEB及PDF等多种格式文件,用于阅读中国知网源数据库中的期刊、学位论文、会议论文、报纸和专业知识仓库中的学术文献。它可以在线阅读中国知网的学术文献,也可以阅读下载到本地硬盘的中国知网全文和通过各种形式获得的PDF文件,是用户查阅学术文献不可或缺的工具软件。

1 CAJViewer的主要使用技巧

CAJViewer的浏览和打印功能被使用者所熟知,但对其他功能可能知之甚少。其实,CAJViewer的功能远不止这些,下面介绍CAJViewer三个非常实用的使用技巧[1]。

1.1 学术文献标注技巧

对于有价值的学术文献,使用者可能要反复研读,重点的内容还必须做上不同的标注,这一要求在CAJViewer中可轻松实现。步骤如下:

点击菜单项“查看”→“标注”,即可在当前文档的主页面左边出现标注管理的窗口,在该窗口下,可以显示并管理当前文档上所作的所有标记。标注共有十种,分别是直线、曲线、矩形、椭圆、文本注释、高亮文本、下划线文本、删除线文本、知识元链接和书签。

在标注窗口里,鼠标点击右键,将弹出5个菜单项,内容如下:删除所选项,将把当前选择的一个标注从文档主界面上删除;清除本类型的所有项,将弹出小的确认对话框,如果选择是,将把文档上本类型的所有标注清除;清除所有标注,将弹出小的确认对话框,如果选择是,将把文档上的所有标注清除;属性,弹出对话框让用户编辑标注的描述信息;设置颜色,改变所选中的标注的颜色。

1.2 学术文献搜索技巧

在阅读学术文献的过程中,CAJViewer可以搜索与使用者提供的关键词匹配的内容。步骤如下:

点击菜单项“编辑”→“搜索”,将会出现搜索窗口,一般在屏幕的右边。在编辑窗口里输入要搜索的文本,选择搜索的范围,内容如下:

1) 在当前活动文档中搜索,搜索结果都将在窗口下部的列表框里显示,搜索完成后主页面上将显示搜索到的第一条文本,点击不同的搜索结果,主页面将进入到相应的区域。

2) 在所有打开的文档中搜索,搜索结果都将在窗口下部的列表框里显示,搜索完成后主页面上将显示搜索到的第一条文本,点击不同的搜索结果,主页面将进入到相应的区域。

3) 在PDL中搜索,如果安装了个人数字图书馆将打开该软件,并在该软件中搜索,搜索结果在个人数字图书馆中显示。

4) 选择范围搜索,选择一个目录进行搜索,将搜索所有CAJViewer可以打开的文件,搜索结果都将在窗口下部的列表框里显示,搜索完成后主页面上将显示搜索到的第一条文本,点击不同的搜索结果,主页面将进入到相应的区域,如果文件没有打开将首先打开文件。

1.3 学术文献识别技巧

对于一些用扫描方式制作的电子文档,由于无法直接复制其中的文字内容,给用户操作带来极大不便。CAJViewer除了能阅读目前国内常见的PDF、CAJ、KDH、NH、CAA、TEB六种电子文档外,还内置了免费的OCR识别工具,可以轻松识别和复制各种文献电子文档内容,实现文档格式的转换,大大节省了论文编辑的时间。

根据文献原文档的生成方式,可选择以下其中一种技巧,对文献文本进行复制或识别。

方法一:文件另存法

在工具栏中选择“文件”→“另存为”,在保存类型中选择“文本文件(*.txt)”,整篇文档即迅速实现了格式转换。此法仅保留文档中文本内容。

方法二:文本选择法

文本选择法可分为普通的按行选择和按区域选择。按行的方式选择:首先,使工具栏上的“选择文本”处于选中状态,然后在页面区按住鼠标左键拖动;按区域的方式选择:使工具栏上的“选择文本”处于选中状态,然后在页面区按住鼠标左键拖动。被变亮显示的文本都是被选中的文本,使用工具栏上的“把选择结果复制到剪贴板”,或可以使用快捷键Ctrl+C来进行。使用编辑软件中菜单中“粘贴”功能或使用快捷键Ctrl+V将文本复制到指定位置,文本转换或复制工作即完成。

方法三:文本识别法

CAJViewer采用的是清华文通的OCR识别技术,识别精度非常高,操作方法非常简单。当工具栏中“选择文本”置灰时,表示不可直接复制,需进行文本识别后方可复制。

点击工具栏中的“文字识别”按钮,然后按住鼠标左键拖动形成选取文字识别范围,稍候就会弹出个“文字识别结果”窗口来显示识别出来的文字内容,点击“复制到剪贴板”按钮可以将该内容保存到剪贴板中使用,若点击“发送到WPS/WORD(W)”按钮则可以自动粘贴到WORD文档使用。[2]

2 文本识别功能的拓展使用

有些学术文献当我们找到它时,它要么是纸质书面材料,要么是在电脑屏幕上显示着,无法拷贝,更无法编辑。使用CAJViewer,您同样可将其转换成可以随意编辑的TXT和WORD文档。首先,将纸质书面材料扫描成图片文件或将屏幕文字截屏保存为图片;然后,使用CAJViewer进行文本识别。具体操作步骤如下:

2.1 纸质文档的扫描或屏幕文字的截屏

扫描或截屏生成文件格式一般有jpeg、bmp、tiff等。为了识别提高识别效果,请将格式设置成bmp、黑白、分辨率设置在300以上。如果是书或杂志,可先把订书针拆开,按顺序逐页平整放在扫描仪上进行扫描。清晰美观的图片,有利于后期编辑与识别。文档扫描成多张图片时,请按顺序进行编号。

2.2 把扫描或截屏的图片文件制成PDF文档

把图片文件转换成PDF文档比较简单的方法是使用Image To PDF软件。[3]

1) 把Image To PDF软件文件夹复制到硬盘任意目录,点击“Image To PDF”图标启动主程序。

2) 点击主界面中的“设置”进行软件的相关设置。在设置对话框的“输出设置”选项卡中,选择第一种输出方式,使用多个图像文件生成一个PDF文件,其他使用默认值。

3) 在设置对话框的“图像处理”选项卡中,选择jpeg。压缩质量这项,数值设置大,生成的PDF体积就大,当然也清楚,反之体积就越小,可以通过调节获得最好的效果。

4) 在设置对话框的“页设置”选项卡中,选择A4纸。此外,像PDF水印、加密、信息等其它项,均使用默认值。设置完成后,点击“确认”,保存设置。

5) 返回主界面,点击“文件”→“添加文件”,找到扫描或截屏好并且已经编好号的图片,选定全部图片后打开,打开后您还可以在右边调整顺序。

5) 点击“生成PDF文件”。在存放图片的文件夹里就可以看到已经转换生成的PDF文件。

如果对生成的文件质量不满意,可以通过调整设置里的“图像处理”里的参数来更改文件。

2.3 使用CAJViewer对PDF文件进行文本识别

具体操作参照以上CAJViewer文本识别技巧。

3 常见问题及解决办法

3.1 如何直接打开PDF格式文献

PDF格式文献默认打开方式是使用Acrobat Reader,要使用CAJViewer直接打开PDF格式文献,必须进行文件关联设置,步骤如下:

选择“工具”→“参数设置”;弹出“设置参数”对话框,选择“文件关联”选项,选择“Adobe Acrobat文件(*.PDF)”;点出“应用”或“确定”即可。[4]

3.2 如何截取学术文献中的公式、图表或图片

如果用户要引用或保存原文中的公式、图表或图片,可以使用CAJViewer的图片复制功能,将原文中的公式、图表或图片等复制下来,粘贴到其他文字处理(如Word)或图片处理程序(如 Photoshop)中进行编辑、处理、保存或引用。

运行CAJViewer,打开学术文献文件,点击工具栏中的“选择图像”按钮,然后按住鼠标左键拖动形成选取公式、图表和图片的范围,点击鼠标右键,选择右键菜单中“发送图像到WPS/WORD(W)”,图像将可以自动粘贴到WORD文档中。也可选择右键菜单中“复制CTRL+C”,然后使用快捷键CTRL+V将公式、图表或图片粘贴到任何图片处理软件。

3.3 如何解决无法在线浏览博硕士论文问题

CAJViewer启动时需要将信息下载到本地后才能正常浏览,如果网络速度慢或博硕士论文比较长,浏览器启动的时间相对比较长,这时用户很容易误认为点击链接无效而连续点击“在线浏览”。其实这时已经是打开了数个CAJViewer进程,而导致系统无响应。

解决办法:打开“任务管理器”,在进程列表中可以看到很多个正在运行的CAJViewer.exe进程,将这些进程保留一个或全部结束,等待片刻便可浏览到全文了。

3.4 如何解决浏览文献时显示乱码问题

1) 首先检查CAJViewer的版本,如果程序版本较低,请进入中国知网(http://www.cnki.net/)下载。

2) 检查系统的字体目录(C:WINDOWSFonts),看是否有以“CAJ”开头的字体文件,如果有,按F5刷新显示;如果没有,需重新安装最新版本的CAJViewer全文浏览器,然后重新启动计算机。

3) 如果是非中文环境,请先至少安装一种中文字体,然后设置CAJViewer全文浏览器的默认字体为中文字体。

4) 在BIG5环境下,选择默认字体最好设置“细明”为中文字体,不要设置楷体等其他字体。

3.5 如何解决将CAJ中的文字粘贴到WORD中显示乱码问题

可以在打开WORD或记事本的同时打开中文输入法,然后再将CAJviewer中复制的文字拷贝粘贴到WORD或记事本中,一般可以解决此类问题。

3.6 如何解决“文字识别”出现错误识别比例过高问题

在CAJViewer浏览器中,打开“工具”→“参数设置”,打开“参数设置”对话框;选择“浏览”选项卡,将选项内“平滑文本”前的√去掉,按“确定”保存设置即可。

3.7 如何取消学术文献下载时的提示对话框

在点击学术文献下载后,如果您认为弹出的“文件下载处理”对话框是多余的,请先选择文件保存位置,然后将“在打开这种类型的文件前始终询问”前的打勾去掉,点击“确定”即可取消学术文献下载时多余的提示对话框。

3.8 如何设置可以使CAJViewer不保存历史纪录

在默认情况下,CAJViewer会保存用户的浏览历史,如果涉及用户隐私,可取消这个功能。解决方法如下:

单击“开始”→“运行”,输入regedit并回车,打开注册表编辑器,如使用的是CAJViewer 7.0,应找到[HKEY_CURRENT_USERSoftwareTTKNCAJViewer 7.0Config],然后在此项中新建名为“SaveFileHistory”的DWORD值,并设为“0”即可。

3.9 如何设置可以使CAJViewer不保存文件列表

在默认情况下,关闭CAJViewer时,都会保存已打开的文件列表。在某些情况下,用户可能不需要此功能。解决方法如下:

运行CAJViewer,在文件菜单中选择“工具”→“参数设置”,在出现的对话框中切换到“通用”,选上“退出时提示保存打开的文件列表”,然后关闭程序(必须有打开的文件),就会出现提示是否要保存文件列表,选择“否”并勾选上“记住我的选择,下次不要提醒我”的选项,此后就不会有提示,也不会再保存打开的文件列表。

3.10 如何解决自动更新完成后无法正常浏览文献内容问题

这一问题主要是由于程序没有正常关闭,导致一些参数保存不正常所致。解决方法如下:

单击“开始”→“运行”,输入Regedit并回车,打开注册表编辑器,手工删除注册表下列键:[HKEY_CURRENT_USERSoftwareTTKN/CAJViewer 7.0]。

启动CAJViewer会出现自动升级,请“取消”,在菜单栏单击“工具”→“参数设置”→“通用”选项卡,取消掉“自动更新”,选择“从不检查”。

提示:如果此问题还得不到完全解决,可能是文件本身保存了不正确的浏览参数所致,可使用工具菜单中的“重置所有参数”来解决。

4 结束语

CAJViewer作为一款专门的学术文献浏览软件,支持多种不同类型的文献格式。既可取代Adobe Reader阅读器对PDF的浏览功能,又不需要单独使用OCR软件而进行文本识别,极大地方便用户对学术文献的浏览和使用。

[1] 中国知网.CAJViewer 7.0常见问题列表[EB/OL].http://cajviewer.cnki.net/cajviewer7/help/faq.html.

[2] 无人喝彩.看抓一体化CAJViewer[J].电脑迷,2006(2):69.

[3] 张秀秀,张立峰.PDF文件文本内容提取研究[J].科技情报开发与经济,2008(36):118.

[4] 田学军.PDF文件格式及其转化方法探讨[J].荆门职业技术学院学报,2005(5):30.

[责任编辑:张超]

FunctionsandSkillsoftheUsageofCAJViewerintheacademicliterature

GUO Ping

(XianTao Vocational College Xiantao 433000, China)

CAJViewer, as a special browser software for academic literature, compatible with a variety of documentation formats, has a lot of functions such as viewing page, finding text, text recognition, transferring Internet mail and so on. The software has two highlights as follows: supporting PDF browse and OCR text recognition. It can solve problems accurately. We can greatly facilitate the users to browse and use the academic literature if one can use its function flexiblely.

CAJ files; PDF file; OCR recognition; CAJViewer; academic literature

G255.75

A

1671-6876(2011)04-0357-04

2011-05-20

郭萍(1963-),男,湖北省仙桃人,教授,主要从事高等职业教育理论及计算机网络安全研究。

猜你喜欢
工具栏对话框文档
浅谈Matlab与Word文档的应用接口
“玩转”西沃白板
有人一声不吭向你扔了个文档
正常恢复虚拟机
Bootlace Worms’Secret etc.
What Is Beauty?
基于RI码计算的Word复制文档鉴别
浅谈VB的通用对话框《CommonDialog》控件的使用
Persistence of the reproductive toxicity of chlorpiryphos-ethyl in male Wistar rat
设计一种带工具栏和留言功能的记事本