网站首页
centos上libreoffice+unoconv安装步骤,实现word转pdf(可以php读取pdf页码)
php读取docx页码比较难操作,并且读取doc格式的页码数更难搞了,
所以先将doc/docx/pptx/ppt 先转换为pdf,然后通过pdf读取页码就比较精确了
一、libreoffice安装
1、yum search libreoffice查询一下系统自带的安装包


1、http://pkgs.repoforge.org/unoconv/在这里下载适合你自己系统的unoconv安装包,我下载的是unoconv-0.5-1.el6.rf.noarch.rpm ,如果以上链接不可用可以在http://rpmfind.net/linux/RPM/dag/redhat/el6/i386/unoconv-0.5-1.el6.rf.noarch.html上下载
或者点击下载unoconv-0.5-1.el6.rf.noarch.rpm

产生这个machine-id文件
通过php方法调用以上命令即可,例如:
$cmd_body = "/usr/bin/unoconv -f pdf -o {$pdfPath} {$path}";
$cmd_head = "su --login root --command";
$rootpasswd = "服务器密码";
$cmd_full = \sprintf("%s \"%s\"", $cmd_head, $cmd_body);
$fp = \popen($cmd_full, "w");
\fputs($fp, $rootpasswd);
\pclose($fp);
也可以使用php 中的 exec去执行!
php去取 pdf 页码
$pdftext = file_get_contents(APP_PATH . "public/tmp/2.pdf");
$num = preg_match_all("/\/Page\W/", $pdftext, $dummy);
相关推荐
-
Linux内核调优(大并发场景下)
为了让系统能够支持更大的并发,除了必须安装event扩展(或libevent扩展)之外,优化linux内核也是重中之重,以下优化每一项都非常非常重要,请务必按逐一完成。打开文件 /etc/sysctl.conf,增加以下设置#该参数设置系统的TIME_WAIT的数量,如果超过默认值则会被立即清除 ...
-
[LuPHP] PHPMVC精简框架第一讲(基本MVC框架配置)
LuPHP是一个精简版的PHPMVC框架,该框架经历了N个高可用系统的测验(数据存储量千万级别,并发1000),该框架结合了市面上流行的PHP框架,去除了臃肿的代码;本框架遵循即用即写的原则,做到项目中绝不存在多余(实际根本用不上)代码!该框架作者历经10年以上项目研发经验,总结并写出一套适合自己的... -
php7下安装event扩展
一·、安装支持库libevent,需要编译高版本(这里以最新版本release-2.1.8-stable为例)1. wget -c https://github.com/libevent/libevent/releases/download/release-2.1.8-stable/libevent...
-
mysqlbinlog 保存为sql文件。
执行如下命令:mysqlbinlog -vv --base64-output=decode-rows binlog路径 --result-file=要保存的sql路径例如:/www/server/mysql/bin/mysqlbinlog -vv --base64-output=decode-row...
-
js websocket
<!doctype html> <html> <head> <meta charset="utf-8"> <title></title> <script src="https://www.lizh...
-
PHP性能优化方案
常用性能优化方案1.使用单引号替换双引号,单引号在运行的时候不检查运行引号内部的变量,执行效率是双引号的两倍;2.使用PHP内置的数组操作方法,PHP内置的数组操作方法的运行效率是自行编写代码的10倍以上;3.使用字符串函数替换正则函数,例如:使用 str_replace 替换&...
-
如何安装php7的event扩展
最近api系统遇到了高并发的瓶颈,想通过workerman重构。在看workerman文档时发现这么一句话:Event扩展不是必须的,当业务需要支撑上万并发连接时,推荐安装Event,能够支持巨大的并发连接。如果业务并发连接比较低,例如1000并发连接,则可以不用安装。如果无法安装Event扩展,可...
-
Intellij IDEA 快捷键整理
【常规】Ctrl+Shift + Enter,语句完成“!”,否定完成,输入表达式时按 “!”键Ctrl+E,最近的文件Ctrl+Shift+E,最近更改的文件Shift+Click,可以关闭文件Ctrl+[ OR ],可以跑到大括号的开头与结尾Ctrl+F12,可以显示当前文件的结构Ctrl+F7...
php读取docx页码比较难操作,并且读取doc格式的页码数更难搞了,所以先将doc/docx/pp...
PHP是一种国内外流行的开源服务器端脚本开发语言。能适应大、中、小型项目的发展需要。PHP框架的真正...