用户指南IM CW2200

将原稿扫描为包含嵌入文本数据的PDF文件

要在PDF查看应用程序中搜索和复制文本，您可以将文本数据嵌入根据扫描数据创建的PDF中（OCR功能）。

您还可以将此功能用于 PDF (JPEG 2000) 或 PDF/A 格式的 PDF 文件。

重要信息

要使用此功能，需要选配的OCR单元。
需要选购配置的功能
下列情况中无法使用OCR功能：
- 选定TIFF或JPEG作为文件类型。
- 选定[150 dpi]作为分辨率。

按主页画面上的[扫描]。

操作面板画面插图

在扫描画面上按[发送设置]。

操作面板画面插图

按[文件类型][其他]。

操作面板画面插图

按 [PDF]，[PDF(JPEG 2000)] 或 [PDF/A]。

按[页面设置]，然后选择[单页]为每页创建PDF文件，或者选择 [多页]创建多页PDF文件。

按[OCR设置]，然后指定如何执行OCR。

操作面板画面插图

OCR认知语言：选择与要扫描的原稿所用语言相同的语言。
删除空白页：在创建PDF文件时，从扫描数据中删除空白页。
将提取的文字添加至文件名：提取确定最合适作为文件名的文本字符串，并自动添加到文件名。将从第一页扫描数据中提取文本字符串。如果第一页不包含文本，则不会在文件名中追加任何字符串。
使用扫描的文本方向修正垂直方向：根据在OCR过程中成功识别的字符方向，确定原稿的垂直方向。

完成OCR设置后，按[OK]。

在“原稿类型”中指定图像质量。

要提高识别准确度，请选择[黑白：文字]。

操作面板画面插图

要将扫描的文档发送到某个电子邮件地址，请按[发件人]，然后指定发件人。

在扫描画面上指定目的地。

放置原稿。如果扫描没有自动启动，请按[开始]。

在原稿台面上放置原稿

在基本为空白的页面上，可能无法正确确定页面的垂直方向。
在嵌入文本的PDF文件中搜索字符串时，您可以通过指定搜索设置来忽略半角和全角字符，从而更轻松地找到要搜索的字符串。
开始扫描下一页的时间可能会更长，具体取决于原稿尺寸或分辨率。
OCR功能可处理每页多达40,000个字符的文本。
OCR功能可识别以下语言：
- 英语、德语、法语、意大利语、西班牙语、荷兰语、葡萄牙语、波兰语、瑞典语、芬兰语、匈牙利语、挪威语、丹麦语、日语。
当通过指定放大比例缩小以200 dpi或更大分辨率扫描的图像时，有效分辨率可能低于200 dpi。在这些情况下可以应用OCR功能，但文本识别精确度可能会降低。
根据字符的形状或类型，字符可能无法正确识别。
如果扫描页面不包含可以识别为文字的部分，则生成PDF文件不包含嵌入式文本。
如果文件的所有页都被确定为空白页，则无法生成PDF文件。如果出现这种情况，请确保正确放置原稿并重试。
如果扫描页面弄脏或有污点，或可以看见页面背面的图像，则无法识别空白页或页面顶端和底端。
将OCR功能应用到扫描时，则无法识别任何类型页面。如果打印文字或嵌入式文字的宽度不同，则嵌入式文字与扫描页中打印文字的位置可能不吻合。