盗版图书的这一常规制作过程注定了盗版图书必然会存在大量错字、别字、漏字、缺页和错误内容,因为目前世界上还没有一种文字扫描技术能够做到100%正确地将文字扫描进电脑一点错误不出(例如对纸页上较淡的笔画、污迹、污点等无法正确识别与处理),也没有一种OCR软件能够100%地正确识别扫描出来的图片中的文字与符号,将其一个不错地转变为可编辑排版的文字字符(尤其是对医学书, OCR软件的字库里本来就没有那么多偏僻少见但数量可观的医学专业名词和符号,自然也就不可能将其准确地识别出来)。
也就是说,在盗版书的制作过程中,源于扫描仪和OCR软件的天生缺陷而产生大量文字符号差错成为必然。