sape

Блог Саповода

Всё еще скребёте кисточкой?

Рано или поздно, у саповодов возникает вопрос, где брать контент.

Кто-то использует средства автоматического парсинга RSS, новостей, сайтов (кисточка, скребок и т.п.), кто-то делает ручной рерайт. Я перепробовал практически все способы и по прошествии года и всяких АГС могу сказать вполне уверенно.

Наиболее устойчивый контент для сайтов – это распознанные сканы книг. Времени это занимает безусловно больше автоматических систем, но результат значительно надёжнее. И кроме того, в данном случае мы всё же не мусорим в интернете, а делаем полезное дело.

16 комментариев на “Всё еще скребёте кисточкой?”

  1. Антонинка высказал:

    Думаю, этим «полезным делом» довольны далеко не все правообладатели…

    Хороший комментарий. Проголосуй: Thumb up 17 Thumb down 2

    [Ответить]

    Netsu Ответ:

    torrents.ru тоже не все довольны, но работает :)

    Оцените: Thumb up 3 Thumb down 1

    [Ответить]

    Flesher Ответ:

    увы, но именно торрентс.ру не работает :) )

    Хороший комментарий. Проголосуй: Thumb up 5 Thumb down 0

    [Ответить]

    Netsu Ответ:

    Ну для кого то может и не работает.
    Пиров: 9,889,502 сиды: 8,940,029 личи: 949,473

    Скорость обмена: 43.7 GB/s

    Хороший комментарий. Проголосуй: Thumb up 10 Thumb down 2

  2. vini-puh34 высказал:

    не факт что контент будет оригинальным. Очень много книг уже есть в интернете. Каким образом предавать им уникальность и при этом нормальное качество текства?

    Оцените: Thumb up 0 Thumb down 0

    [Ответить]

    Yurik Ответ:

    А кто мешает проверить уникальность до скана?

    Оцените: Thumb up 1 Thumb down 0

    [Ответить]

  3. Манимейкер высказал:

    vini-puh34, для этого берется несколько абзацев с начала, середины, и проверяется в ПС, что бы не делать лишнюю работу. И книжки нужно брать старее, что бы к вам не было претензий, кстати как вариант можно покупать уже готовый скан, стоит он дёшево.

    Оцените: Thumb up 1 Thumb down 0

    [Ответить]

    neSEOshnik Ответ:

    А где готовый скан купить можно, не подскажешь?

    Оцените: Thumb up 0 Thumb down 0

    [Ответить]

  4. Игорь высказал:

    Манимейкер, а где готовый скан купить можно, не подскажете?

    Оцените: Thumb up 0 Thumb down 0

    [Ответить]

  5. Компосапиенс высказал:

    А почему переводы буржуйских текстов проигнорировали? Как вариант для особо изощренных – скан буржокниг и их перевод – вот где точно уникальный контент ))

    Оцените: Thumb up 0 Thumb down 0

    [Ответить]

  6. Андрей высказал:

    Да пробывал я сканы пробивать по плагиатусу, в результате практически 90 процентов уже есть в интернете…

    Оцените: Thumb up 0 Thumb down 0

    [Ответить]

  7. Vesb высказал:

    А данные сайты в линкуете между собой? или каждому сайту тИЦ поднимается отдельно друг от друга?

    Оцените: Thumb up 0 Thumb down 0

    [Ответить]

  8. Макс высказал:

    Чем распознаешь ?

    Оцените: Thumb up 0 Thumb down 0

    [Ответить]

  9. aro высказал:

    Кстати, какими сервисами проверяете уникальность? Так чтобы наверняка?

    Оцените: Thumb up 0 Thumb down 0

    [Ответить]

  10. creator высказал:

    Не согласен, взял десяток книг недавно, прогнал на уникальность выборочно некоторые абзацы, получилось в среднем 85% – хреново. Сейчас контента в нета хватает, а скаждым днем все больше и больше, не один ты такой умный, так что книги через годик и совсем отпадут. Нужно либо заказывать, либо самому делать, а лучше всего дать пользователям доступ, пусть сами страницы заполняют.

    Оцените: Thumb up 0 Thumb down 1

    [Ответить]

  11. SugarDelivery высказал:

    Нечищенный скан выпаливает яндекс, и это говно идет разом в бан. Если уж нарушать закон – лучше парсить открытые сайты или вконтакт.

    Оцените: Thumb up 0 Thumb down 0

    [Ответить]

Комментировать

Категории

Метки

Архив

Февраль 2012
Пн Вт Ср Чт Пт Сб Вс
« Июл    
 12345
6789101112
13141516171819
20212223242526
272829  
Онлайн экспресс-кредиты от LendMoney.ru

RSS