Настройка основных параметров работы NewsGrabber
В административной консоли, в пункте меню "Настройки", находятся параметры которые необходимо настроить перед началом работы со скриптом.
1. Настройка получения новостей

Использовать прокси для получения текста новости - если этот параметр отмечен, вся работа скрипта будет производится через прокси-сервера. Пункт, совершенно необязательный, например я его не использую. Как настроить получение прокси-серверов для работы функции будет описано ниже.
Проверка на дубликаты для новых текстов - при включении данной опции, скрипт будет проверять сграбленный контент на наличие его близких аналогов в существующих материалах. При включении данного параметра, необходимо выставить процентный показатель оригинальности контента. Например при показателе 30% в публикацию пройдут лишь материалы, у которых совпадение шинглов с предыдущими материалами не более 30%. При автоматической работе скрипта я использую показатель 30%. При работе в режиме ручной модерации - 50%
Внимание!!! использование данной функции значительно повышает нагрузку MySQL. Если у вас виртуальный хостинг, лучше отказаться от использования данной функции
Сколько дней хранить шинглы - так как шинглы занимают значительный объем в базе данных (в 1,5 - 4 раза превышает объем базы контента за аналогичный период), а повторение материалов на различных источниках как правило продолжается в период 1-1,5 месяца после появления первой публикации, имеет смысл хранить шинглы за определенный промежуток времени. Например 45 дней.
Сохранять картинки - при выключении данного параметра, изображения присутствующие в источнике не сохраняются на сервере.
Уменьшать картинки используя mogrify. - если для обработки изображений используется модуль mogrify, то укажите полный путь к модулю на сервере. Если путь задан и существует - GD не используется для обработки изображений. При установки скрипта этот параметр определяется автоматически. У модуля Mogrify стоит больший приоритет чем у GD так как он обеспечивает лучшее качество обработки.
Уменьшать картинки используя GD - данный пункт должен быть отмечен при отсутствии на сервере модуля mogrify. Следует помнить, что изображения в формате GIF модулем GD не сохраняются. Использование GIF с GD возможно только при преобразовании размера "на лету". Для уменьшения "на лету" галочку не ставить. Для уменьшения "на лету", в шаблонах надо использовать нижеописанную конструкцию вызова картинки
например на сайте http://www.estateinfo.ru/ существует картинка по адресу http://www.estateinfo.ru/images/220_2933.jpg.
- Записав URL вида http://www.estateinfo.ru/get_img.php?img=220_2933.jpg&size=500:400 , мы увеличим изображение до 500 пикселов по ширине и до 400 пикселов по высоте.
- Записав URL вида http://www.estateinfo.ru/get_img.php?img=220_2933.jpg&size=500: , мы увеличим изображение до 500 пикселов по ширине, по высоте изображение увеличиться пропорционально.
- Записав URL вида http://www.estateinfo.ru/get_img.php?img=220_2933.jpg&size=:400 , мы увеличим изображение до 400 пикселов по высоте, по ширине изображение увеличиться пропорционально.
Данный способ изменения размеров изображения "на лету" можно использовать в шаблонах вывода списков новостей и их заголовков.
Создавать картинки с размерами... - при получении картинки с источника, кроме оригинальной картинки, мы можем получать дополнительное изображение нужного нам размера.
Например на гланой странице cfqnf http://www.estateinfo.ru/ при выводе анонсов новостей используются изображения 2-х размеров: для блока главной новости - изображение с шириной 170 пикселов, для блоков разделов изображения шириной 110 пикселов. В поле размеров пишем 170:,110: Теперь при получении изображения abc.jpg будут создаваться дополнительно 2 его копии - prw_170x_of_abc.jpg и prw_110x_of_abc.jpgю При создании шаблона код вставки этих изображений выглядит так:
Минимальный и максимальный размеры картинок - пределы размеров при которых полученное изображение будет сохраняться на сервере
Ручная модерация награбленного - при включении данного режима весь контент перед публикацией проходит ручную модерацию, т.е. администратор сайта должен вручную активировать публикацию материала.
Адрес, куда посылать письма о награбленном - на этот адрес посылается отчет о работе NewsGrabber. Функция полезна при использовании режима ручного модерирования
2. Отображение новостей и настройка RSS ленты

Использовать символьное преобразование URL новости - включает использование "человеко-понятных-урл" (ЧПУ) в URL адресе новостей
Кодировать ссылки в тексте с помощью JavaScript - при использовании функции ссылки встречающиеся в тексте, кодируются с помощью JavaScript
Добавлять в ссылки rel="nofollow" - при использовании функции d ссылки встречающиеся в тексте добавляется атрибут rel="nofollow"
Открывать ссылки из текста новости в новом окне - если есть вопросы, то спрашивайте
Сколько символов из текста использовать, если нет дескрипшена - при получении текста из RSS часто встречается ситуация, когда в RSS ленте отсутствует описание. Используя эту функцию, скрипт берет описание из начала текста новости.
Поля новости при просмотре - выбор полей, который выводятся при просмотре полного текста публикации
Показывать блок последних новостей при просмотре новости - при включении параметра, отображается лента последних новостей
Показывать блок главных новостей при просмотре новости - при включении параметра, отображается блок главных новостей
В настройках RSS ленты необходимо ввести параметры которые отображаются в XML коде ленты новостей сайта.
Для пользователя доступны полная лента новостей сайта в RSS формате по адресу: http://www.vashdomen.ru/desc/?rss=1 а также ленты разделов по адресу http://www.vashdomen.ru/razdel/?rss=1
источник
В административной консоли, в пункте меню "Настройки", находятся параметры которые необходимо настроить перед началом работы со скриптом.
1. Настройка получения новостей
Использовать прокси для получения текста новости - если этот параметр отмечен, вся работа скрипта будет производится через прокси-сервера. Пункт, совершенно необязательный, например я его не использую. Как настроить получение прокси-серверов для работы функции будет описано ниже.
Проверка на дубликаты для новых текстов - при включении данной опции, скрипт будет проверять сграбленный контент на наличие его близких аналогов в существующих материалах. При включении данного параметра, необходимо выставить процентный показатель оригинальности контента. Например при показателе 30% в публикацию пройдут лишь материалы, у которых совпадение шинглов с предыдущими материалами не более 30%. При автоматической работе скрипта я использую показатель 30%. При работе в режиме ручной модерации - 50%
Внимание!!! использование данной функции значительно повышает нагрузку MySQL. Если у вас виртуальный хостинг, лучше отказаться от использования данной функции
Сколько дней хранить шинглы - так как шинглы занимают значительный объем в базе данных (в 1,5 - 4 раза превышает объем базы контента за аналогичный период), а повторение материалов на различных источниках как правило продолжается в период 1-1,5 месяца после появления первой публикации, имеет смысл хранить шинглы за определенный промежуток времени. Например 45 дней.
Сохранять картинки - при выключении данного параметра, изображения присутствующие в источнике не сохраняются на сервере.
Уменьшать картинки используя mogrify. - если для обработки изображений используется модуль mogrify, то укажите полный путь к модулю на сервере. Если путь задан и существует - GD не используется для обработки изображений. При установки скрипта этот параметр определяется автоматически. У модуля Mogrify стоит больший приоритет чем у GD так как он обеспечивает лучшее качество обработки.
Уменьшать картинки используя GD - данный пункт должен быть отмечен при отсутствии на сервере модуля mogrify. Следует помнить, что изображения в формате GIF модулем GD не сохраняются. Использование GIF с GD возможно только при преобразовании размера "на лету". Для уменьшения "на лету" галочку не ставить. Для уменьшения "на лету", в шаблонах надо использовать нижеописанную конструкцию вызова картинки
| Код: |
| <img
src="{HTTP_ROOT}get_img.php?img={news_image}&size=XXX:YYY"
mce_src="{HTTP_ROOT}get_img.php?img={news_image}&size=XXX:YYY"> где XXX - ширина картинки YYY - высота картинки |
например на сайте http://www.estateinfo.ru/ существует картинка по адресу http://www.estateinfo.ru/images/220_2933.jpg.
- Записав URL вида http://www.estateinfo.ru/get_img.php?img=220_2933.jpg&size=500:400 , мы увеличим изображение до 500 пикселов по ширине и до 400 пикселов по высоте.
- Записав URL вида http://www.estateinfo.ru/get_img.php?img=220_2933.jpg&size=500: , мы увеличим изображение до 500 пикселов по ширине, по высоте изображение увеличиться пропорционально.
- Записав URL вида http://www.estateinfo.ru/get_img.php?img=220_2933.jpg&size=:400 , мы увеличим изображение до 400 пикселов по высоте, по ширине изображение увеличиться пропорционально.
Данный способ изменения размеров изображения "на лету" можно использовать в шаблонах вывода списков новостей и их заголовков.
Создавать картинки с размерами... - при получении картинки с источника, кроме оригинальной картинки, мы можем получать дополнительное изображение нужного нам размера.
Например на гланой странице cfqnf http://www.estateinfo.ru/ при выводе анонсов новостей используются изображения 2-х размеров: для блока главной новости - изображение с шириной 170 пикселов, для блоков разделов изображения шириной 110 пикселов. В поле размеров пишем 170:,110: Теперь при получении изображения abc.jpg будут создаваться дополнительно 2 его копии - prw_170x_of_abc.jpg и prw_110x_of_abc.jpgю При создании шаблона код вставки этих изображений выглядит так:
| Код: |
| <img
src="{DOWNLOAD_IMAGES_DIR_HTTP}prw_170x_of_{news_image}"
mce_src="{DOWNLOAD_IMAGES_DIR_HTTP}prw_170x_of_{news_image}"> <img src="{DOWNLOAD_IMAGES_DIR_HTTP}prw_110x_of_{news_image}" mce_src="{DOWNLOAD_IMAGES_DIR_HTTP}prw_110x_of_{news_image}"> |
Минимальный и максимальный размеры картинок - пределы размеров при которых полученное изображение будет сохраняться на сервере
Ручная модерация награбленного - при включении данного режима весь контент перед публикацией проходит ручную модерацию, т.е. администратор сайта должен вручную активировать публикацию материала.
Адрес, куда посылать письма о награбленном - на этот адрес посылается отчет о работе NewsGrabber. Функция полезна при использовании режима ручного модерирования
2. Отображение новостей и настройка RSS ленты
Использовать символьное преобразование URL новости - включает использование "человеко-понятных-урл" (ЧПУ) в URL адресе новостей
Кодировать ссылки в тексте с помощью JavaScript - при использовании функции ссылки встречающиеся в тексте, кодируются с помощью JavaScript
Добавлять в ссылки rel="nofollow" - при использовании функции d ссылки встречающиеся в тексте добавляется атрибут rel="nofollow"
Открывать ссылки из текста новости в новом окне - если есть вопросы, то спрашивайте
Сколько символов из текста использовать, если нет дескрипшена - при получении текста из RSS часто встречается ситуация, когда в RSS ленте отсутствует описание. Используя эту функцию, скрипт берет описание из начала текста новости.
Поля новости при просмотре - выбор полей, который выводятся при просмотре полного текста публикации
Показывать блок последних новостей при просмотре новости - при включении параметра, отображается лента последних новостей
Показывать блок главных новостей при просмотре новости - при включении параметра, отображается блок главных новостей
В настройках RSS ленты необходимо ввести параметры которые отображаются в XML коде ленты новостей сайта.
Для пользователя доступны полная лента новостей сайта в RSS формате по адресу: http://www.vashdomen.ru/desc/?rss=1 а также ленты разделов по адресу http://www.vashdomen.ru/razdel/?rss=1
источник
Комментариев нет:
Отправить комментарий