网站首页
centos上libreoffice+unoconv安装步骤,实现word转pdf(可以php读取pdf页码)
php读取docx页码比较难操作,并且读取doc格式的页码数更难搞了,
所以先将doc/docx/pptx/ppt 先转换为pdf,然后通过pdf读取页码就比较精确了
一、libreoffice安装
1、yum search libreoffice查询一下系统自带的安装包


1、http://pkgs.repoforge.org/unoconv/在这里下载适合你自己系统的unoconv安装包,我下载的是unoconv-0.5-1.el6.rf.noarch.rpm ,如果以上链接不可用可以在http://rpmfind.net/linux/RPM/dag/redhat/el6/i386/unoconv-0.5-1.el6.rf.noarch.html上下载
或者点击下载unoconv-0.5-1.el6.rf.noarch.rpm

产生这个machine-id文件
通过php方法调用以上命令即可,例如:
$cmd_body = "/usr/bin/unoconv -f pdf -o {$pdfPath} {$path}";
$cmd_head = "su --login root --command";
$rootpasswd = "服务器密码";
$cmd_full = \sprintf("%s \"%s\"", $cmd_head, $cmd_body);
$fp = \popen($cmd_full, "w");
\fputs($fp, $rootpasswd);
\pclose($fp);
也可以使用php 中的 exec去执行!
php去取 pdf 页码
$pdftext = file_get_contents(APP_PATH . "public/tmp/2.pdf");
$num = preg_match_all("/\/Page\W/", $pdftext, $dummy);
相关推荐
-
编程语言排行榜2019年12月 TIOBE编程语言排行榜2019年最新版
TIOBE已经公布了编程语言排行榜2019年12月的数据,编程语言12月的排名有了新的变化,Java比C的指数高了2%,与上个月的0.2%相比,前进很多,Python继续占领第三名,下面一起来看看2019年12月编程语言排行榜。 2019年12月编程语言排行榜看点: 首先,Java比上个月的指... -
mysqlbinlog 保存为sql文件。
执行如下命令:mysqlbinlog -vv --base64-output=decode-rows binlog路径 --result-file=要保存的sql路径例如:/www/server/mysql/bin/mysqlbinlog -vv --base64-output=decode-row...
-
.htaccess中301强制跳转到带www前缀或不带www的域名
相信很多站长朋友都有这样的的问题出现。即带www前缀的域名与不带www前缀的顶级域名收录情况是不同的。这个问题主要是由于搜索引擎对于顶级域名与二级域名权重判定不同造成的。毫无疑问地,唯一的域名能够给你带来更多的好处。不管它是带www还是不带www。因为,这样无论用户还是搜索引擎都会记住你网站的唯一域...
-
centos7/linux 服务器 添加新硬盘并挂载
一、查看现有磁盘设备 fdisk -l 发现/dev/sdb 为新加的硬盘;二、开始分区 fdisk /dev/sdb fdisk -l #再次查看分区情况,已经有了/dev/sdb1三、创建文件系统,并格式化 mkfs.ext4 /dev/sdb1四、将新分区挂在到文件系统 mk...
-
11个代码质量审核和管理工具,程序员收藏
如今,代码质量分析和审核已成为每个企业的基本流程。随着开源代码库使用的增加,安全性和代码质量对于构建高质量软件至关重要。不良的代码不仅会影响代码的可维护性,而且还会在某些情况下影响其性能。此外,更好的代码质量还有助于企业将来减少维护和降低成本。幸运的是,有很多审核和管理代码的工具,为开发者和程序员提... -
docker 容器支持中文
客户有个需求:将table内容转换成图片显示;后端语言采用java;使用组件 HtmlImageGenerator结果发现,windows下中文不乱码,但是用docker部署到linux就乱码了所以先尝试不使用docker,结果还是乱码,然后给服务器安装中文字体(安装方法自行百度),安装好...
-
php的性能优化
1.尽量静态化: 如果一个方法能被静态,那就声明它为静态的,速度可提高1/4,甚至我测试的时候,这个提高了近三倍。 当然了,这个测试方法需要在十万级以上次执行,效果才明显。 其实静态方法和非静态方法的效率主要区别在内存:静态方法... -
Scheduled 定时任务
Scheduled 定时任务1 cron表达式指定定时器执行时间// 固定每天1点执行,无论上一次执行完没有,到时间会再执行。@Scheduled(cron = "0 0 1/1 * ?")//每一个小时执行一次@Scheduled(cron = "0 0 * * * ?") //每天上午...
php读取docx页码比较难操作,并且读取doc格式的页码数更难搞了,所以先将doc/docx/pp...
PHP是一种国内外流行的开源服务器端脚本开发语言。能适应大、中、小型项目的发展需要。PHP框架的真正...