Мы в твиттере Мы в телеграме!

Провеббер » Всё для uCoz » Универсальный граббер с DLE сайтов на uCoz (модуль новости)

Набор в команду! Ведется набор в команду, для наполнения сайта новым, интересным контентом. Если у тебя есть предложения, свободное время, ты обладаешь интересным контентом, и хочешь поделиться с другими?
Обращайся к нам в ЛС группы Вконтакте.

Универсальный граббер с DLE сайтов на uCoz (модуль новости)

Данный материал предоставлен сайтом ProWebber.cc исключительно в ознакомительных целях. Администрация не несет ответственности за его содержимое.
Скачать бесплатно Универсальный граббер с DLE сайтов на uCoz (модуль новости).

Описание:
Универсальный граббер с DLE сайтов на uCoz (модуль новости)

Краткое инфо по пользованию граббера:

1. Требования к хостингу
Версия PHP >= 5;
Должна присутствовать библиотека iconv;
Хостинг должен быть с поддержкой сокетов.

2. Установка
1) Залейте содержимое скрипта на хостинг.
2) Установите на директорию cache права на запись(chmod 777).

3. Настройка
Откройте файл config.php
Впишите ваш домен на укозе:
$_cfg['ucoz']['site'] = 'www.ru';


Установите логин администатора/модератора/репортера и его пароль:

$_cfg['ucoz']['login'] = 'lavrik';
$_cfg['ucoz']['password'] = '785fgsd24asd';


3. Как пользоваться?

Зайдите через браузер http://your_site.ru/grabber_path/
В поле аbout:blank впишите адрес DLE сайта с которого будите граббить и жмите энтер

В новой версии реализовано:
Возможность использовать синонимайзер
Возможность создавать правила для граббинга с любых сайтов(подобных DLE)

Исправленно:
Ставить ссылки в теги
<noindex></noindex>
$_cfg['grabber']['savecontents'] = TRUE; // TRUE - вкл. FALSE - выкл.
Возможность создавать правила для граббинга с любых сайтов(подобных DLE)

Как пропускать содержимое новостей через синонимайзер:

ГЛАВНОЕ: для того чтоб вы могли использовать данную опцию у вас должен быть синонимайзер! Я рекомендую http://smartbyte.org
1) Установите в конфиге
$_cfg['grabber']['savecontents'] = FALSE;

на
$_cfg['grabber']['savecontents'] = TRUE;

2) Установите на директорию contents права на запись(chmod 777)
3) Добавляйте новости как раньше они появятся в папке contents (!! кодировка файлов будет в UTF-8 !!)
4) Пропустите содержимое директории contents через синонимайзер
5) Зайдите через браузер в http://your_site.ru/grabber_path/ на главной странице будет ссылка Залить контент нажмите ее. И ожидайте пока контент будет заливается

Как создавать правила для граббинга с любых сайтов:

1) Откройте файл mysites.txt
2) korrespondent.net меняете на сайт который будите граббить
3) Заходите на главную страницу нажимаете просмотр HTML кода ищите HTML фрагмент который повторяется
допустим это
<div id='news-id
и его закрывающий элемент допустим это
</td></tr>

Между ними поставьте (.*)
Получится
<div id='news-id(.*)</td></tr>

4) [title], [small], [fulllink], [full] - работает по тому же принципу что и [style]
5) [qpage] Фрагмет HTML кода со страницами
Ищет последнюю страницу страницу автоматически
6) [page] - url формат страниц
Например, есть ссылка - http://0day.kiev.ua/modules.php?name=News&pagenum=2
Формат [page] Будет такой http://0day.kiev.ua/modules.php?name=News&pagenum=(.*)
7) Список функций и их предназначение:
@striptags - Ф-ция удаляет теги
@clean - Ф-ция удаляет лишние пробелы, табуляции и тд.
@htmltobb - Ф-ция преобразует HTML код в BB коды
@rm(value) - Ф-ция удаляет содержимое value с текста (например ...)
Описание функций: @a, @a.ТЕГ, @a(текст)б @restart и @emptyhtml
Допустим вам надо поставить имя автора в начале текста или в конце
Например:
<td>Автор: Vasya</td></tr><tr><td><div id='news-2412'>Новость: текст текст текст</div>

То для того чтоб поставить автора в начало необходимо выполнить такие команды
[full]
@a([b ]Автор:[/b ])
Автор: (.*)</td>
@a
@restart
id='news-(.*)</div>
'>Новость: (.*)
@a.center
@emptyhtml

Ф-ция @a - выполняет добавление содержимого в поток
Ф-ция @a.center - выполнит добавление в поток + содержимое будет в тегах Ф-ция @restart - загрузит нетронутый HTML код ( после выполнения команды Автор: (.*) текст для обработки будет Vasya для того чтоб он обрел первичный вид:
<td>Автор: Vasya</td></tr><tr><td><div id='news-2412'>Новость: текст текст текст</div>


надо выполнить команду @restart )
Ф-ция @emptyhtml - в конце обработки сценария [small], [full], [title] обработанный текст автоматически добавляется в поток для того чтоб этого не случилось , используйте данную функцию
Если сайт в кодировке UTF-8 то следует использовать функцию @utf
8) Ну это, пожалуй и все запускайте браузер вводите http://your_site.ru/grabber_path/ и начинайте граббить сайт

Внимание! У Вас нет прав для просмотра скрытого текста.


Дополнительные ссылки на скачивание ТОЛЬКО для зарегистрированных


-3
Просмотры: 38 488 :: Комментарии (8) :: :: Нужна помощь? Задайте вопрос на форуме ::
Теги: grabber, парсер
Уважаемый посетитель, Вы зашли на сайт как незарегистрированный пользователь.
Мы рекомендуем Вам зарегистрироваться либо войти на сайт под своим именем.

#1FTN

  • 21 января 2010 16:35
  • Регистрация: 30.09.2009
  • Был(а) онлайн: 21.10.2014
  • Комментариев: 91
  • -4
Кто заюзал уже?? мне кажется не будет работать...

--------------------

#2MysterIoes

  • 21 января 2010 18:59
  • Регистрация: 22.11.2009
  • Был(а) онлайн: 15.02.2014
  • Комментариев: 356
  • -4
Цитата: FTN
Кто заюзал уже?? мне кажется не будет работать...

Прочитайте эту новость https://prowebber.ru/news/2165-chitat-vsem.html
имхо я в последние время очень добрый diablo

#3sewa

  • 30 января 2010 00:30
  • Регистрация: 29.01.2010
  • Был(а) онлайн: 27.01.2011
  • Комментариев: 47
  • -4
Пытался работать с этим граббером, но его особенность - не у всех идет
У меня не пошло, а у друга на "ура" работает!
видимо из за самописности кода не со всеми параметрами совместим =(

#4SNIPER32

  • 8 февраля 2010 01:13
  • Регистрация: 19.09.2009
  • Был(а) онлайн: 25.02.2022
  • Комментариев: 100
  • -4
Странно не заню как у вас но сколько я не пытался запустить этот граббер не работает ваще

#5filinua

  • 28 октября 2010 23:44
  • Регистрация: 19.10.2010
  • Был(а) онлайн: 18.02.2014
  • Комментариев: 27
  • -4
И чо теперь чмыри с юкоса будут наши сайты грабить,да не дадим в обиду ДЛЕ , ДАВАЙ НАОБОРОТ ПАРСЕРЫ

#6koxakos

  • 29 апреля 2011 00:33
  • Регистрация: 13.02.2011
  • Был(а) онлайн: 9.10.2014
  • Комментариев: 1
  • -4
все работает то просто у кого-то ручки не с того места

#7SalTok

  • 19 июля 2011 20:53
  • Регистрация: 13.09.2010
  • Был(а) онлайн: 19.05.2012
  • Комментариев: 22
  • -4
все работает то просто у кого-то ручки не с того места

axaxaxa

#8AcSeL29

  • 17 мая 2014 20:08
  • Регистрация: 12.11.2010
  • Был(а) онлайн: 6.03.2024
  • Комментариев: 1
  • -4
Наполню сайт на ucoz новостями с выбранного DLE сайта.
Заинтересовало-пишите blush

http://vk.com/id184670789

Информация
Посетители, находящиеся в группе Гости, не могут оставлять комментарии к данной публикации.

Архив новостей
Ноябрь 2024 (9)
Октябрь 2024 (169)
Сентябрь 2024 (13)
Август 2024 (60)
Июль 2024 (12)
Июнь 2024 (30)