check what is being written to our log files.
[Pman.Core] / ConvertStyle.php
1 <?php
2
3 require_once 'Pman.php';
4 require_once 'HTML/CSS/InlineStyle.php';
5
6 class Pman_Core_ConvertStyle extends Pman 
7 {
8     function getAuth()
9     {
10         if (HTML_FlexyFramework::get()->cli) {
11             return true;
12         }
13         $this->authUser = $this->getAuthUser();
14         if (!$this->authUser) {
15             return false;
16         }
17         return true;
18     }
19     
20     function relPath($base, $url)
21     {  
22         
23         if (preg_match('/^(http|https|mailto):/',$url)) {
24             return $url;
25         }
26         
27         $ui = parse_url($base);
28         
29         if($ui['host'] == 'localhost'){
30             return $ui['scheme'] .'://'.$ui['host']. $ui['path'] . '/'. $url;
31         }
32         
33         if (substr($url,0,2) == '//') {
34             return $ui['scheme'] .':' .  $url;
35         }
36         
37         if (substr($url,0,1) == '/') {
38             return $ui['scheme'] .'://'.$ui['host']. $url;
39         }
40         
41         if (substr($ui['path'], -1) == '/') {
42            return $ui['scheme'] .'://'.$ui['host']. $ui['path'] . $url;
43         }
44         if (!strlen($ui['path'])) {
45             return $ui['scheme'] .'://'.$ui['host']. '/' . $url;
46            
47         }
48         
49         return $ui['scheme'] .'://'.$ui['host']. $ui['path'] . '/../'. $url;
50         
51     }
52     
53     function checkHeader($url)
54     {
55         // if(strpos($url, 'https') !== false)
56         // {
57         //     $this->jerr('accept HTTP url only!');
58         // }
59         $headers = get_headers($url, 1);
60         if(strpos(is_array($headers['Content-Type']) ? $headers['Content-Type'][0] : $headers['Content-Type'], 'text/html') === false)
61         {
62             $this->jerr('accept html file only!');
63         }
64         return;
65     }
66     
67     var $styleSheets = array();
68     
69     function convertStyle($url, $file, $is_url = true)
70     {
71         $inLineCss = true;
72         
73         if($is_url && !empty($url))
74         {
75             $host = parse_url($url);
76             require_once 'System.php';
77             $wget = System::which('wget');
78             if (!$wget) {
79                 $this->jerr("no wget");
80             }
81             $cmd =  $wget . ' -q -O -  ' . escapeshellarg($url);
82             
83             //echo $cmd; exit;
84             $data = `$cmd`;
85             
86             if (!trim(strlen($data))) {
87                 $this->jerr("url returned an empty string");
88             }
89         }
90         
91         if(!$is_url){
92             $data = file_get_contents($file);
93         }
94         
95         if(preg_match('/^\s*<!--\s*NOT CONVERT STYLE\s*-->\s*/', $data)){
96             $inLineCss = false;
97         }
98         
99         libxml_use_internal_errors (true);
100         $doc = new DOMDocument('1.0', 'UTF-8');
101         $doc->loadHTML('<?xml encoding="UTF-8">'.$data);
102         $doc->formatOutput = true;
103         
104         $xpath = new DOMXpath($doc);
105         foreach ($xpath->query('//img[@src]') as $img) {
106             $href = $img->getAttribute('src');
107             if (!preg_match("/^http(.*)$/", $href, $matches)) {
108                 if(!empty($url)){
109                     $img->setAttribute('src',  $this->relPath($url,  $href));
110                     continue;
111                 }
112                 $this->jerr('Please use the absolutely url for image src!');
113             }
114         }
115         
116         
117         foreach ($xpath->query('//a[@href]') as $a) {
118             $href = $a->getAttribute('href');
119             if (!preg_match("/^http|mailto|#(.*)$/", $href, $matches)) {
120                 if(!empty($url)){
121                     $a->setAttribute('href', $this->relPath($url,  $href));
122                     continue;
123                 }
124                 $this->jerr('Please use the absolutely url for a href!');
125             }
126         }
127         
128         foreach ($xpath->query('//link[@href]') as $l) {
129             if($l->getAttribute('rel') == 'stylesheet'){
130                 $href = $l->getAttribute('href');
131                 
132                 if(!preg_match("/^http(.*)$/", $href, $matches)){
133                     if(empty($url)){
134                         $this->jerr('Please use the absolutely url for link href!');
135                     }
136                     $href = $this->relPath($url,  $href);
137                 }
138                 
139                 $this->styleSheets[$href] = $this->replaceImageUrl(file_get_contents($href),$href);
140             }
141         }
142         
143         foreach ($xpath->query('//style') as $s){
144             $this->styleSheets[] = $this->replaceImageUrl($s->nodeValue, $url);
145         }
146         
147         $data = $doc->saveHTML();
148         
149         if(!$inLineCss){
150             return $data;
151         }
152         
153         $htmldoc = new HTML_CSS_InlineStyle($data);
154         if(count($this->styleSheets) > 0){
155             foreach ($this->styleSheets as $styleSheet){
156                 $htmldoc->applyStylesheet($styleSheet);
157             }
158         }
159         $html = $htmldoc->getHTML();
160         libxml_use_internal_errors (false);
161         
162         if (!function_exists('tidy_repair_string')) {
163             return "INSTALL TIDY ON SERVER " . $html;
164         }
165         
166         $html = tidy_repair_string(
167                 $html,
168                 array(
169                   'indent' => TRUE,
170                     'output-xhtml' => TRUE,
171                     'wrap' => 120
172                 ),
173                 'UTF8'
174         );
175         
176         
177         return $html;
178         
179     }
180     
181     function replaceImageUrl($stylesheet,$href)
182     {
183         $base = explode("/", $href);
184         $s = preg_split('/url\(([\'\"]?)/', $stylesheet);
185         foreach($s as $k => $v){
186             if($k == 0){
187                 continue;
188             }
189             array_pop($base);
190             array_push($base, $v);
191             $s[$k] = implode("/", $base);
192         }
193         
194         $r = implode("url(", $s);
195         
196         $this->checkImportCss($r);
197         
198         return $r;
199     }
200     
201     function checkImportCss($r)
202     {
203         if(preg_match("/@import url/", $r, $matches)){
204             $importCss = explode("@import url", $r);
205             foreach ($importCss as $css){
206                 if(preg_match("/\.css/", $css, $matches)){
207                     $cssFileName = explode(".css", $css);
208                     $name = preg_replace("/[\(\'\"]/", '', $cssFileName[0]);
209                     $p = $name . '.css';
210                     $this->styleSheets[$p] = $this->replaceImageUrl(file_get_contents($p),$p);
211                 }
212             }
213         }
214         return;
215     }
216     
217 }