Главная » 2009 » Ноябрь » 24 » Полная инструкция по настройке граббера для ucoz
11:07
Полная инструкция по настройке граббера для ucoz
Описание: Универсальный граббер с DLE сайтов на uCoz (модуль новости)
Краткое инфо по пользованию граббера:
1. Требования к хостингу Версия PHP >= 5; Должна присутствовать библиотека iconv; Хостинг должен быть с поддержкой сокетов. 2. Установка 1) Залейте содержимое скрипта на хостинг. 2) Установите на директорию cache права на запись(chmod 777).
3. Настройка Откройте файл config.php Описание: Универсальный граббер с DLE сайтов на uCoz (модуль новости)
Краткое инфо по пользованию граббера:
1. Требования к хостингу Версия PHP >= 5; Должна присутствовать библиотека iconv; Хостинг должен быть с поддержкой сокетов. 2. Установка 1) Залейте содержимое скрипта на хостинг. 2) Установите на директорию cache права на запись(chmod 777).
3. Настройка Откройте файл config.php Впишите ваш домен на укозе:
Зайдите через браузер http://your_site.ru/grabber_path/ В поле about:blank впишите адрес DLE сайта с которого будите граббить и жмите энтер
В новой версии реализовано: Возможность использовать синонимайзер Возможность создавать правила для граббинга с любых сайтов(подобных DLE) Исправленно: Ставить ссылки в теги $_cfg['grabber']['savecontents'] = TRUE; // TRUE - вкл. FALSE - выкл. Возможность создавать правила для граббинга с любых сайтов(подобных DLE)
Как пропускать содержимое новостей через синонимайзер:
ГЛАВНОЕ: для того чтоб вы могли использовать данную опцию у вас должен быть синонимайзер! Я рекомендую Smartbye 1) Установите в конфиге
2) Установите на директорию contents права на запись(chmod 777) 3) Добавляйте новости как раньше они появятся в папке contents (!! кодировка файлов будет в UTF-8 !!) 4) Пропустите содержимое директории contents через синонимайзер
5) Зайдите через браузер в http://your_site.ru/grabber_path/ на главной
странице будет ссылка Залить контент нажмите ее. И ожидайте пока
контент будет заливается
Как создавать правила для граббинга с любых сайтов: 1) Откройте файл mysites.txt 2) korrespondent.net меняете на сайт который будите граббить 3) Заходите на главную страницу нажимаете просмотр HTML кода ищите HTML фрагмент который повторяется допустим это
Автор: Vasya
Новость: текст текст текст
То для того чтоб поставить автора в начало необходимо выполнить такие команды [full] @a([b ]Автор:[/b ]) Автор: (.*) @a @restart id='news-(.*) '>Новость: (.*) @a.center @emptyhtml Ф-ция @a - выполняет добавление содержимого в поток
Ф-ция @a.center - выполнит добавление в поток + содержимое будет в
тегах Ф-ция @restart - загрузит нетронутый HTML код ( после выполнения
команды Автор: (.*) текст для обработки будет Vasya для того чтоб он
обрел первичный вид:
Code
<td>Автор: Vasya</td></tr><tr><td><div id='news-2412'>Новость: текст текст текст</div>
надо выполнить команду @restart )
Ф-ция @emptyhtml - в конце обработки сценария [small], [full], [title]
обработанный текст автоматически добавляется в поток для того чтоб
этого не случилось , используйте данную функцию Если сайт в кодировке UTF-8 то следует использовать функцию @utf 8) Ну это, пожалуй и все запускайте браузер вводите http://your_site.ru/grabber_path/ и начинайте граббить сайт Незабудьте скачать сам граббер
Пользователей: 2371 Новых за месяц: 24 Новых за неделю: 4 Новых вчера: 0 Новых сегодня: 0Темы на форуме: 331 Сообщения на форуме: 2285 Материалы на сайте: 637 Комментарии к материалам: 268