четверг, 16 июля 2015 г.

Что такое сплог? почему лучше сплоги wordpress? Эксперимент №1

сплогПриветствую всех, наконец-то добрался до написания нового поста, в котором решил рассказать «что такое сплог» и почему многие делают именно сплоги wordpress? Для тех, кто не знает что вообще такое сплог, думаю, после прочтения данного поста станет ясно.  На написание данной статьи меня подтолкнуло желание создать сплог исключительно для эксперимента, который я буду проводить, и публиковать результаты здесь. Наверное, каждый бы хотел посмотреть на ход и результаты эксперимента.

Сплог на WordPress : плагины и парсеры авто-блоггинга

Приветствую премногоуважаемые !
Давненько не постил — да оно и не удивительно — ведь на улице ЛЕТО ! :) Время распределяется на офлайн работу, семью — оставшееся на летний отдых (со следующей неделе вообще вырвусь в отпуск — мысленно уже там).

Как сделать сайт с автообновлением по RSS?

Сейчас весьма актуально делать сайты, которые самостоятельно обновляются, используя сторонние источники контента. В основном контент импортируется посредством RSS, хотя бывают случаи, когда и из дизайна прямо выдирают :)
Цели в таких ситуациях преследуются разные

Сплоги на wordpress: полный FAQ

Рад вас приветствовать на странице своего блога! Темой сегодняшнего разговора будут сплога на wordpress, а точнее их создание.
Что же такое сплог? Сплог является обычным блогом или сайтом, но с автонаполнением (автонаполнение осуществляется за счет грабберов).

Сплоги создаются для разных целей, ими прокачивают сайты, устраивают из них линкопомойку и так же многое другое.
Для чего именно вы их поднимете решать исключительно вам, так что приступим к созданию.

Домен для сплога

Не думаю, что нужно расписывать подробную регистрацию домена, просто упомяну основные моменты. Домены я регистрирую на 2domains.ru по 100р за ру зону.
Стоит наверно упомянуть о том, что домен желательно регистрировать тематический, с основным ключом в его тексте.
Например мы поднимаем сплог о форексе, значит домен регистрируем newforex24.ru.

Движок для сплога

Под сплоги можно использовать любой движок, но я предпочитаю и считаю, что для этого лучше всего подходит wordpress. Тем более, в данном посте мы рассматриваем разработку сплога именно да данной cms.
Этот движок прост в установке, для его оптимизации написано просто море плагинов, и так же есть плагины для организации граббинга.

Плагины для оптимизации сплога wordpress

  1. Dagon Design Sitemap Generator – данный плагин генерирует на отдельной странице карту сайта, вещь нужная и очень полезная.
  2. Google XML Sitemaps – плагин генерирует для сплога xml карту.
  3. All In One SEO Pack – плагин для сео оптимизации, без него никуда.
  4. Related Posts – плагин для вывода похожих постов, автоматизирует перелинковку сайта.
  5. Pixel Sitemap – плагин выводит при помощи виджета ссылки на все посты вашего сплога в сайдбаре в виде однопиксельных картинок. Плагин улучшит индексацию и поможет вам заработать больше в линкобиржах так как увеличит количество страниц 2-го уровня (плгин не обязателен, но для линкопомойки я бы посоветовал)

Плагины для создания сплога на wordpress

1. WP-o-Matic плагин для граббинга rss каналов на wordpress сплог
Данный плагин является ключевым для создания wordpress сплога. Прост в работе и весьма эффективен. Вводите в него RSS канал сайта донора и плагин через CRON периодически грабит информации и публикует ее в указанных разделах.
И так нам нужно подобрать от 5-10 RSS каналов и до количества которое вас удовлетворит, без лишней грязи, в виде левых ссылок и тп.
Так же хочу заметить, что часто встречаются каналы, где идет только анонс статьи, данные rss ленты тоже можно использовать. Для этого идем на сервис fulltextrssfeed.com, вставляем в форму линк на rss канал который нам нужно раскрыть и жмем submit. Все, получившуюся раскрытую ленту вставляем в наш плагин.
И так создаем новую компанию. Название новой компании вписываем в тайтл.
WP-o-Matic граббер rss каналов для wordpress
Теперь напротив каждого поля, вписываем адреса наших каналов.
В идеале, под каждый канал нужно создавать новую компанию, что бы было меньше не тематических постов в категориях.
WP-o-Matic граббер rss каналов для wordpress
Далее нам нужно выбрать в какую категорию будет транслироваться rss лента.

Ну и хотелось бы упомянуть о вкладке rewrite. Данная функция плагина позволяет заменять при парсинге слова на необходимые вам. Например заменять линки, или под категории если такие имеются.
Ниже на картинке можете посмотреть как это выглядит.
WP-o-Matic граббер rss каналов для wordpress
Проверяем как работает плагин для сплога wordpress, если все норм, значит переходит к следующему пункту.
2. Unikalizator плагин для синоминайза
Данный плагин синомизирует сграбленную информацию и тем самым уникализируя ее, что помогает создать видимость уникального контента.
Данное чудо выглядит так, в данное поле нужно вводить синонимы, но большое количество синонимов грузить через форму крайне не советую так как виснет.
Unikalizator синоминайзер для wordpress
База синонимов идет таким форматом – слово|синоним1,синоним2,синоним3
Быстрее всего большой объем будет импортировать напрямую в mysql базу через phpmyadmin на хостинге вашего сплога wordpress. Данное действо у вас займет всего минуту.
3. WP Robot 3 еще один плагин грабинга информации на ваш сплог wordpress
Данный плагин позволит вам грабить видео с ютьюб а так же информацию с других источников.
В настройке не сложнее предыдущих плагинов. Процент видео на сайте советую сохранять 20%-30% от всего публикуемого контента.
Вот наконец настал конец и вы собрали свой первый сплог на wordpress. Советую контент ваших сплогов разбавлять рерайтом и копирайтом, что бы не словить фильтры от поисковых систем за копипаст.

четверг, 9 июля 2015 г.

Как создать свой первый сплог и заработать на нем.

Если у тебя есть свой сайт или блог, то ты наверняка мог заметить, как другие сайты автоматически копируют твой контент, тем самым отнимая твоих посетителей. Такие сайты называются сплогами. Если быть точнее, то это обычные паразиты, зарабатывающие за счет других ресурсов. Как они создаются

Комплект плагинов для самонаполняемого сайта на WordPress


Anti-XSS attack. Закрывает возможность XSS-атак в WP.
Bookmarkz. Этот плагин после каждого поста вставляет ссылки на добавление страницы в сервисы социальных закладок. Опять таки, с ним сайт выглядит “человечнее”.
Exec-PHP. Плагин, позволяющий выполнение PHP-кода в текстах постов, страницах и виджетах. С помощью него в сайдбар удобно добавлять Sape.ru.

Советы по настройке NewsGrabberJC

При создании новой ленты в NG следует сделать такие настроики:
Название ленты, адрес ленты – без комментариев;
Секция – раздел, в который необходимо помещать новости;
Категория – соответственно категория, в которую необходимо помещать новости;
Допущена – ставим да;
Следующие настройки

Настройка ленты http://www.icar.com.ua/rss/sport_rss.xml

Предлагаем вашему вниманию несколько нестандартный вариант настройки RSS ленты, когда NewsGrabber не может распознать начало и конец новости:

Грабим ленту сайта Авто ру

Пример граббинга ленты при помощи NewsGrabbing
Лента:

Установка NewsGrabber

Установка NewsGrabber

Установка скрипта на хостинг осуществляется с помощью скрипта nginstall.php. Скрипт вызывается из корневой директории вашего домена и сам скачивает и устанавливает на ваш хостинг все необходимые для работы NewsGrabber скрипты. Для использования скрипта nginstall.php установите на корневую папку хоста права доступа (например 777), позволяющие запись в нее скриптам.

Вывод новостей NewsGrabberа на главной странице сайта

Как вывести новости, на главную страницу сайта www.мойсайт.ru, если NewsGrabber установлен в директории, например, www.мойсайт.ru/news/ ?
Для решения проблемы необходимо сделать следующее:
В файле, в котором нужно выводить новости, например, www.мойсайт.ru/index.php пишем в том месте, где они должны выводиться:
<? include "http://www.мойсайт.ru/news/index.php"?>
Затем приводим внешний вид новостного блока к дизайну главной страницы, для этого редактируем шаблон главной страницы NewsGrabbera здесь:
http://www.мойсайт.ru/news/admin/templates.php?action=edit&item=1
и здесь:
/news/css/master.css

Установка заданий CRONTAB

Установка заданий CRONTAB

Для обеспечения автоматической работы скрипта нам необходимо настроить задания crontab для скриптов, которые находятся в папке /admin/cron:

-необязательные задания, необходимы в случае работы NewsGrabber через прокси-сервера
а) check.proxy.php - скрипт для проверки работоспособности прокси-серверов. Рекомендем устанавливать запуск этого скрипта каждые 2-3 часа
б) get.proxy.php - скрипт для получения списка прокси-серверов с публичных листов. Рекомендем устанавливать запуск этого скрипта каждые 12 часов.

- обязательное задание
- source.getcontent.php - скрипт для получения контента с сайтов. Рекомендуем устанавливать одно задание на каждые 20 источнико с интервалом выполнения 5 минут. При добавлении нового задания для скрипта source.getcontent.php выставляйте время обновления таким образом, что бы оно не пересекалось с выполнением первого задания.

Инструкции по установке заданий crontab для различных хостингов, вы можете найти на страницах помощи вашего хостинга или обратиться в службу поддержки для получения инструкций
   


источник

Настройка основных параметров работы NewsGrabber

Настройка основных параметров работы NewsGrabber

В административной консоли, в пункте меню "Настройки", находятся параметры которые необходимо настроить перед началом работы со скриптом.

Настройка структуры сайта в скрипте NewsGrabber

Структура сайта

Этот раздел не требует особого внимания так как здесь отображены базовые элементы, которые в принципе не редактируются. В настройках пунктов структуры сайта можно указавать название модуля, содержание тега TITLE, мета-тегов DESCRIPTION и KEYWORDS, а также папку модуля отображаемую в URL. Собственно ради этих настроек этот пункт меню и существует.


Настройка парсинга контента в скрипте NewsGrabber

Настройка парсинга контента

Пожалуй самый сложный раздел в админке - RSS ленты Smile

Небольшая вводная... Для сбора контента, нам необходимо получить с сайта-источника RSS или ATOM ленту с заголовками и ссылками на полный текст. В случае если такой ленты у сайта нет, то можно использовать страницы сайта на которых есть обновляемый список заголовков и ссылок, по простому говоря - нам необходима страница с новостной лентой. 


Получение контента без RSS/ATOM лент

Получение контента без RSS/ATOM лент

Не всегда на сайте-источнике можно встретить ленты в формате RSS/ATOM. Поэтому мы добавили в NewsGrabber возможность получения заголовков и ссылок на полный текст с обычных HTML страниц.

Скрипт NewsGrabber: редактирование новостей

Раздел НОВОСТИ

Внешний вид интерфейса:



Скрипт NewsGrabber: Раздел HTML-блоки

Раздел HTML-блоки

HTML-блок - это составная часть HTML-кода сайта, которая вызывается из шаблонов конструкцией <tpl html_block>

В то место, где стоит вызов HTML-блока будет вставляться тот код который вы укажите при добавлении HTML-блока, если шаблон URL страницы соответствует указанному. 




Скрипт NewsGrabber: шаблоны

Шаблоны


Заходя в раздел "шаблоны" мы видим список используемых шаблонов и CSS файлы. CSS нас не интересует, так как к принципу работы с шаблонами они не имеют отношения а служат лишь для оформления тех шаблонов которые составите вы самостоятельно.

Итак, самый ГЛАВНЫЙ Smile шаблон это index.main. Его содержимое показывается на всех, без исключений, страницах. Мы его используем для вывода начала и конца HTML кода который на всех страницах одинаков. Вот пример этого шаблона: 



Советы по работе с компонентом NewsGrabberJC (граббинг rss лент) для Joomla

При создании новой ленты в NG следует сделать такие настроики:
Название ленты, адрес ленты – без комментариев;
Секция – раздел, в который необходимо помещать новости;
Категория – соответственно категория, в которую необходимо помещать новости;
Допущена – ставим да;


Шаблоны для NewsGrabberJC

Некоторые шаблоны для NewsGrabberJC, возможно они окажутся вам полезны


Для чего нужны автоматические грабберы информации

В современном интернете посещаемость сайта напрямую зависит от частоты обновления информации на сайте. Поэтому для нормального функционирования сайт должен постоянно пополняться новыми материалами, которых требуется все больше.
Для наполнения сайта новыми статьями владельцам сайтов зачастую приходится нанимать людей, к-е должны их писать. Такой подход, бесспорно, самый лучший, но что делать, когда на это не хватает средств, а регулярно обновлять контент необходимо?
Для этого существуют специальные автоматические скрипты, позволяющие забирать материалы с других сайтов – грабберы и парсеры.


О блоге

Распространение новостей в интернете в виде RSS лент принимает все большие масштабы. Вместе с этим все более популярными становятся скрипты – грабберы RSS лент, позволяющие публиковать на сайте не только анонс RSS новости, но и полный её текст. Для движка Joomla такой скрипт реализован в виде компонента NewsGrabberJC.

Несмотря на тот факт, что компонент не нов и довольно распространен, информации о том, как им пользоваться, настраивать различные ленты крайне мало. На сайте разработчика такая информация доступна только тем пользователям, которые купят лицензию на использование компонента. Когда я начал освоение NewsGrabberJC JC, у меня таковой не было. И теперь, я хочу поделиться своим опытом работы с компонентом.