当阅读包含表格和文本的单词 docx 时
到 pytn 与 pytn-docx 的符号都刚刚被丢弃。这些符号都是用正常的插入符号步骤创建的。它说它来自 FontSymbol,Character code179,来自Symbol (decimal)
Pytn-docx 只是将其显示为“”。它左侧的“加号或减号”符号也是如此。
当从段落中读取文本(不是表中的文本)时,我使用以下代码:
def listText():
test = docx.Doent('Problem.docx')
testp=test.paragraphs[0] #The only paragraph in the test docx
stringThatSuldHaveSymbol = testp.text
print(stringThatSuldHaveSymbol)
return stringThatSuldHaveSymbol
这仅从仅包含这些符号的文档返回“如果它具有符号,则 10 它将只返回 10。
我也尝试了这种 XML 方法,但即使返回“”。
def get_accepted_text(p):
"""Return text of a paragraph after accepting all changes"""
xml = p._p.xml
if "w:del" in xml or "w:ins" in xml:
tree = docx.Doent.XML(xml)
runs = (node.text for node in tree.geerator(TEXT) if node.text)
return "".join(runs)
else:
return p.text
for p in doc.paragraphs:
print(p.text)
print("---")
print(get_accepted_text(p))
print("=========")
有没有办法以编程方式将这些符号(小数)转换为 Unicode(十六进制)?
试试这个
单击符号下拉列表并选择(普通文本)
现在选择你的特殊符号
如果你现在读 docx 文件,你应该得到你的符号。
不知道为什么符号字体不起作用。在 Arial 中,179 是 3 上标。
本站系公益性非盈利分享网址,本文来自用户投稿,不代表边看边学立场,如若转载,请注明出处
评论列表(61条)