我用汉王的PDF ocR把一个PDF的英文文章转成了TXT文件,但是我发现它把PDF中每个上一行的英文和下一行英文单词连起来了,我想把这连起来的英文分开,请问有什么办法?不一定要用WORD。相当多没有明显标记,相连的单词各种各样的都有