Yahoo! Pipes наша справа - труба

Справді, минулий приклад, дещо неприродно натягнуто демонстрував деякі вищі межі складного, не всім доступного трубопровідного мистецтва. і був спочатку задуманий, лише як плавна вступна в цю тему. А тепер, переходимо до давно обіцяної ефективної фільтрації RSS на практиці - то, що вже можна (і потрібно!) Використовувати кожному зайнятій людині в своїй щоденній інтернет-життя. Отже, знову розглядаємо службу Yahoo! Pipes, і сьогоднішній наш приклад буде називатися:







«Приклад другий: про фотографа, великого любителя почитати е-книжки»

Отже, продовжимо наш дуже короткий курс навчання базових можливостей Yahoo! Pipes. Вчора ми розглянули наш перший приклад з перекладу довільно обраної rss-стрічки на довільний мова для її ретрансляції вже в необхідному мовою (звичайно, при цьому з деякими неминучими втратами в якості, т. К. Сучасні електронні перекладачі ще не досягли свого піку досконалості). Сьогодні ж ми створимо ще один схожий пайп, і, на що дуже сподіваюся, він буде також практично затребуваний в нашому реальному житті. Ми покажемо техніку фільтрування ваших rss-стрічок з множинних джерел і, щоб не втрачати час, відразу переходимо до нашої навчальної ситуації.

Постановка задачі. давайте припустимо, що ми маємо справу з фанатичним фотолюбителем, який моніторить по rss величезна кількість онлайнових бібліотек електронних книг, щоб не пропустити з знову приходять туди книг нічого, пов'язаного з його улюбленим фотосправою. Звичайно, користуючись підготовленим нами сьогодні прикладом, в реальному житті ви зможете запросто змінити тематику моніторингу великої кількості rss-стрічок на будь-яку іншу, цікаву саме вам, тут же ми будемо вчити просто загальним принципам цієї техніки, тому конкретна обрана тематика прикладу не грає ніякої значущої ролі.

Отже, для початку визначимося з вхідними потоками rss-стрічок. Для цього я довільно виберу кілька rss-трансляцій з деяких популярних онлайнових бібліотек, ось вони:

Після чого зливаємо все п'ять стрічок в одну, для чого скористаємося модулем Union (в групі Operators). Для цього втягуємо всі п'ять трубопроводів з п'яти джерел в верхню частину елемента Union.

Все це була лише підготовча частина, а тепер переходимо до ключового етапу - фільтрації контенту. Для цього трохи нижче Union монтуємо елемент Filter (беремо його знову в групі Operators). Як його налаштування вкажемо такі параметри: в випадаючому списку вибираємо Permit. т. е. режим, при якому фільтр буде пропускати тільки ті елементи стрічки, які задовольняють якомусь вказаному критерію. У нашому випадку налаштуємо фільтр на більш м'який режим any (еквівалент логічної операції АБО), який дозволяє пропускати елемент при задоволенні хоча б однієї з наведених умов (якщо у вас їх буде декілька). А тепер, власне, налаштуємо і цей самий критерій фільтрації: як значення поля Rules вибираємо зі списку item.title. далі вибираємо умова Contains (т. е. «елемент повинен містити в собі») і, нарешті, справа вказуємо своє ключове слово для фільтрації - «фото».

Перша умова готове. Додамо ще два повністю подібних йому умови для перевірки наявності іншого улюбленого слова фотографів - «Фотошоп». Тиснемо плюсик поруч зі словом Rules і послідовно додаємо: item.title. Contains. photoshop; також дублюємо це ж умова для російськомовних стрічок: item.description. Contains. фотошоп. Після цього виконуємо завершальну частину для будь-якого пайпа - возз'єднується його останній робочий елемент трубопроводом з елементом фінального виведення - Pipe Output. Ну ось і все - клацаємо по заголовку заключного пайпа, він спалахує помаранчевим кольором, приводячи в роботу весь цей пекельний трубопровідний механізм, і чекаємо пару секунд результатів роботи нашого пайпа в віконці для налагодження (нижня частина екрану з заголовком Debugger: Filter).







Тут потрібно, мабуть, трохи повторити сказане вже в першому прикладі. Елемент rss-стрічки item.title має відношення до заголовку rss-стрічки (т. Е. Це заголовок поста), а елемент item.description - до вмісту кожного конкретного пункту rss-стрічки (т. Е. Це вже текст-вміст цього самого поста). Тому вибирайте об'єкт для фільтрації, виходячи з ситуації, але в будь-якому випадку слід врахувати, що вибір item.description буде давати більше помилкових спрацьовувань, хоча і буде потенційно краще просівати інформаційний потік на потрібні вам ключові слова. Звичайно, варто як слід продумати набір ключових слів для охоплення вашої цільової теми, адже саме від цього і буде залежати ефективність і надійність даного типу моніторингу.

Yahoo! Pipes наша справа - труба
Другий приклад пайпа-фільтра: TestPipe2-FotoBooksFilter

Трохи статистики: на момент збереження цього прикладу в сукупної трансляції цих 5 фідів було опис близько 350 свіжих книг, в результаті роботи цього фільтра ми маємо можливість завжди бачити тільки фіди, які жорстко позначені нашою тематикою моніторингу (в нашому випадку було виділено всього 4 книги по тематиці фотосправи).

Допрацьовуємо другий приклад: від теорії до реального життя

Повертаючись до нашого другого прикладу - потрібно визнати, що, хоча він чудово працює, він все ж недостатньо досконалий, і це стане особливо помітно в реальному житті на великій кількості входять фідів, тому вдосконалюємо його, не втрачаючи часу.

Але і цього мало, продовжимо вдосконалення нашого самопального трубопровідного новинного агрегату.

Припустимо, що з усього різноманіття фідів, які приходять до нашого гіпотетичного фотомайстрові, він окремо хотів би виділити деякі. Наприклад, все, де хоч якось згадується його улюблений фотоапарат Canon EOS 600D. Для цього можна підсвітити, підкреслити або якось іншим способом виділити цю подстроку в одержуваних фідах. З усіх вищеназваних способів я покажу найпростіший спосіб виділення: як можна виділити лідируючими знаками оклику конкретний фид, де міститься згадка такого важливого для вас поняття або явища. Для цього я скористаюся знову складовою конструкцією з циклічного модуля Loop (для проходу по кожній новині в стрічці) і строкового оператора String Replace (для заміни необхідних подстрок).

Yahoo! Pipes наша справа - труба
Другий покращений приклад пайпа-фільтра:
TestPipe2-FotoBooksFilter [full]

Як завжди, поглянути безпосередньо на код цього поліпшеного пайпа можна тут.

Yahoo! Pipes наша справа - труба

Що дуже важливо, якщо подібні фінти раніше були доступні тільки просунутим веб-програмістам, то зараз, за ​​допомогою Yahoo! Pipes. подібні веб-додатки здатний створювати будь-який пересічний користувач Інтернету, хіба що за умови наявності у нього творчої фантазії. Двадцять перше століття в Інтернеті - це вік додатків Web 2.0, індивідуальних до кожного і інтерактивних до наших потреб, що змінюються, тому сьогодні ми і розглянули один з найбільш знаменитих конструкторів з цієї області, що дозволяє безкоштовно створювати подібні сучасні міні-додатки всім бажаючим без обмежень.

Кілька цікавих фактів про Yahoo! Pipes:

І хоча поки, цей цикл статей ставиться як би на паузу, обящаю вам, що незабаром ми повернемося до теми Yahoo! Pipes і його побратима YQL. і я покажу вам вже просунуті і неочевидні приклади використання цієї служби для грабінга (тут пропущено слово - чужих) сайтів, - і все тільки для зручності і приколу, не користі, заради.

Захід Рунета вручну

  • Кхарн »Все зрозуміло, цікаво. Одне питання, які нахрен "більшовички" у вас? Вас уже забанили в гуглі і ви не розумієте, в чому різниця між більшовиками з радянською владою і нинішніми олігархами у.

Пояснюємо суть MapReduce "на пальцях"

  • Kostia »Більш менш зрозуміло як працює, але не зашкодить ще розповісти, чим цей підхід такий хороший, і яку користь (в порівнянні з альтернативами) він приносить.

Рунет приречений. Частина 2

До питання про VPN і його кармічно-негативному трафіку

  • NoSupport »Дзвінок в тех. підтримку провайдера: "Пінг на вас не йде, показує обрив лінії". Відповідь з Сапорта - у вас віруси на виндовс. "У мене опен Сусі. Немає Віндовс". Сапорт в впадає.
  • Mikhail »» не жив в СРСР, не може не розуміти Прошу вибачення, одне _не_ явно зайве.
  • Неанонім »2NoSupport: 95% дзвінків відбиває стандартної перевіркою, для решти 5% у вигляді нестандартних осей, мікротіков, людей, які знають, що кажуть є друга-третя лінії або оформлення тікета. Ну і рідкісний птах у вигляді.
  • Анонім »Після Сноудена завжди стежу за новинами про те як держава любить лізти в наші труси, але. Але в даному випадку тут навіть не пахне, а смердить нобросом на вентилятор.

ФСБ взяла за жопу: історія на ніч для адмінів і блогерів

  • Аз Воздамов »Чувак зробив фейк про самого себе. Нахер він потрібен фсб






Схожі статті