网站首页
centos上libreoffice+unoconv安装步骤,实现word转pdf(可以php读取pdf页码)
php读取docx页码比较难操作,并且读取doc格式的页码数更难搞了,
所以先将doc/docx/pptx/ppt 先转换为pdf,然后通过pdf读取页码就比较精确了
一、libreoffice安装
1、yum search libreoffice查询一下系统自带的安装包


1、http://pkgs.repoforge.org/unoconv/在这里下载适合你自己系统的unoconv安装包,我下载的是unoconv-0.5-1.el6.rf.noarch.rpm ,如果以上链接不可用可以在http://rpmfind.net/linux/RPM/dag/redhat/el6/i386/unoconv-0.5-1.el6.rf.noarch.html上下载
或者点击下载unoconv-0.5-1.el6.rf.noarch.rpm

产生这个machine-id文件
通过php方法调用以上命令即可,例如:
$cmd_body = "/usr/bin/unoconv -f pdf -o {$pdfPath} {$path}";
$cmd_head = "su --login root --command";
$rootpasswd = "服务器密码";
$cmd_full = \sprintf("%s \"%s\"", $cmd_head, $cmd_body);
$fp = \popen($cmd_full, "w");
\fputs($fp, $rootpasswd);
\pclose($fp);
也可以使用php 中的 exec去执行!
php去取 pdf 页码
$pdftext = file_get_contents(APP_PATH . "public/tmp/2.pdf");
$num = preg_match_all("/\/Page\W/", $pdftext, $dummy);
相关推荐
-
CentOS下php安装imagick扩展
1、安装ImageMagic[root@localhost download]# wget http://www.imagemagick.org/download/ImageMagick.tar.gz[root@localhost download]# tar -xzvf ImageMagick[r...
-
docker 容器支持中文
客户有个需求:将table内容转换成图片显示;后端语言采用java;使用组件 HtmlImageGenerator结果发现,windows下中文不乱码,但是用docker部署到linux就乱码了所以先尝试不使用docker,结果还是乱码,然后给服务器安装中文字体(安装方法自行百度),安装好...
-
面试还搞不懂redis,快看看这40道面试题(含答案和思维导图)
1、什么是 Redis?.2、Redis 的数据类型?3、使用 Redis 有哪些好处?4、Redis 相比 Memcached 有哪些优势?5、Memcache 与 Redis 的区别都有哪些?6、Redis 是单进程单线程的?7、一个字符串类型的值能存储最大容量是多少?8、Redis 的持久化机... -
centos7 docker 安装配置nginx
第一步:docker pull nginx第二步:宿主机文件映射Nginx里的配置访问页面目录位置 /data/nginx/html主配置文件nginx.conf位置 /data/nginx/nginx.confnginx.conf文件内容###################user ...
-
java 生成缩略图 imageIO异常:Unsupported Image Type, 不支持图像类型【附解决办法】
最近再做图片生成缩略图功能,发现大部分的图片都可以生成缩略图,但是偶尔有几个图片会报异常:Unsupported Image Type;几经折腾,发现报异常的图片格式为CMYK 格式,我们常见的图片格式都是RGB格式的,所以我们要把CMYK格式的图片转换成RGB格式的,网上有些办法转化后图片颜色会丢...
-
mysqlbinlog 保存为sql文件。
执行如下命令:mysqlbinlog -vv --base64-output=decode-rows binlog路径 --result-file=要保存的sql路径例如:/www/server/mysql/bin/mysqlbinlog -vv --base64-output=decode-row...
-
.htaccess文件设置某目录下所有文件禁止访问
如网站,有些目录下的文件不允许被下载则需要设置.htaccess文件为了减少服务器压力:应将apache配置文件<Directory /> AllowOverride All</Directory> 最好修改成指定目录: <...
-
js websocket
<!doctype html> <html> <head> <meta charset="utf-8"> <title></title> <script src="https://www.lizh...
php读取docx页码比较难操作,并且读取doc格式的页码数更难搞了,所以先将doc/docx/pp...
PHP是一种国内外流行的开源服务器端脚本开发语言。能适应大、中、小型项目的发展需要。PHP框架的真正...