使用 PHP 转换 Microsoft Word 特殊字符

2023-07-16php开发问题
1

本文介绍了使用 PHP 转换 Microsoft Word 特殊字符的处理方法,对大家解决问题具有一定的参考价值,需要的朋友们下面随着跟版网的小编来一起学习吧!

问题描述

我正在尝试转换用户粘贴的包含 MS Word 省略号和长破折号的 Word 文本,然后再进一步处理.

I am trying to convert Word text pasted by users that contain MS Word ellipsis and long dash before processing it further.

我在这里找到了一个旧的建议解决方案http://www.codingforums.com/archive/index.php/t-47163.html ,但它对我不起作用.例如,替换省略号后,变量返回为空.以前从未见过这样的事情:

I found an old proposed solution here to the problem http://www.codingforums.com/archive/index.php/t-47163.html , but it does not work for me. After replacing the ellipsis for example , the variable comes back as empty. Never seen anything like this before:

$src = "Long word dash – and weird Word ellipsis…";
$src = str_replace("‘", "'", $src);
$src = str_replace("’", "'", $src);
$src = str_replace(""", '"', $src);
$src = str_replace(""", '"', $src);
$src = str_replace("–", "-", $src);
$src = str_replace("…", "...", $src);
print $src;

有什么想法吗?

推荐答案

对于在 PHP 中遇到菱形问号的人来说,这种替换 UTF-8 字符的方法比使用 chr 函数效果更好.

For anyone getting the diamond question mark in PHP, this method of replacing UTF-8 characters worked better than using the chr function.

$search = [                 // www.fileformat.info/info/unicode/<NUM>/ <NUM> = 2018
                "xC2xAB",     //  (U+00AB) in UTF-8
                "xC2xBB",     //  (U+00BB) in UTF-8
                "xE2x80x98", // ‘ (U+2018) in UTF-8
                "xE2x80x99", // ’ (U+2019) in UTF-8
                "xE2x80x9A", //  (U+201A) in UTF-8
                "xE2x80x9B", //  (U+201B) in UTF-8
                "xE2x80x9C", // " (U+201C) in UTF-8
                "xE2x80x9D", // " (U+201D) in UTF-8
                "xE2x80x9E", //  (U+201E) in UTF-8
                "xE2x80x9F", //  (U+201F) in UTF-8
                "xE2x80xB9", //  (U+2039) in UTF-8
                "xE2x80xBA", //  (U+203A) in UTF-8
                "xE2x80x93", // – (U+2013) in UTF-8
                "xE2x80x94", // — (U+2014) in UTF-8
                "xE2x80xA6"  // … (U+2026) in UTF-8
    ];

    $replacements = [
                "<<", 
                ">>",
                "'",
                "'",
                "'",
                "'",
                '"',
                '"',
                '"',
                '"',
                "<",
                ">",
                "-",
                "-",
                "..."
    ];

    str_replace($search, $replacements, $string);

这篇关于使用 PHP 转换 Microsoft Word 特殊字符的文章就介绍到这了,希望我们推荐的答案对大家有所帮助,也希望大家多多支持跟版网!

The End

相关推荐

PHP实现DeepL翻译API调用
DeepL的翻译效果还是很强大的,如果我们要用php实现DeepL翻译调用,该怎么办呢?以下是代码示例,希望能够帮到需要的朋友。 在这里需要注意,这个DeepL的账户和api申请比较难,不支持中国大陆申请,需要拥有香港或者海外信用卡才行,没账号的话,目前某宝可以...
2025-08-20 php开发问题
168

PHP通过phpspreadsheet导入Excel日期数据处理方法
PHP通过phpspreadsheet导入Excel日期,导入系统后,全部变为了4开头的几位数字,这是为什么呢?原因很简单,将Excel的时间设置问文本,我们就能看到该日期本来的数值,上图对应的数值为: 要怎么解决呢?进行数据转换就行,这里可以封装方法,或者用第三方的...
2024-10-23 php开发问题
287

mediatemple - 无法使用 codeigniter 发送电子邮件
mediatemple - can#39;t send email using codeigniter(mediatemple - 无法使用 codeigniter 发送电子邮件)...
2024-08-23 php开发问题
11

Laravel Gmail 配置错误
Laravel Gmail Configuration Error(Laravel Gmail 配置错误)...
2024-08-23 php开发问题
16

将 PHPMailer 用于 SMTP 的问题
Problem with using PHPMailer for SMTP(将 PHPMailer 用于 SMTP 的问题)...
2024-08-23 php开发问题
4

关于如何在 GoDaddy 服务器中使用 PHPMailer 设置 SMTP 的问题
Issue on how to setup SMTP using PHPMailer in GoDaddy server(关于如何在 GoDaddy 服务器中使用 PHPMailer 设置 SMTP 的问题)...
2024-08-23 php开发问题
17