Онлайн парсер на JavaScript для извлечения списка подписчиков Instagram

Здесь можно вытянуть список подписчиков Instagram в форме списка содержащего три колонки: Имя, Ник-нейм, Ссылка на профиль.

Как пользоваться:

1. Откройте окошко где показываются подписчики или те на кого подписаны вы.
2. Пролистайте весь список вниз до конца. Можно зажать клавишу End или Page Down, чтобы не мотать долго колесом, если у вас много строк. Нужно чтобы прогрузились все.
3. Нажмите правой кнопкой мыши и выберете «Сохранить как…». Сохраните.
4. Откройте сохраненный файл в браузере. Можно просто перетащить этот файл прямо в окно браузера.
5. Нажмите правой кнопкой мыши и выберете «Просмотр кода страницы». Выделите код и вставьте в окошко.
6. Нажмите кнопку «Обработать» и наслаждайтесь результатом. Можно например скопировать в Excel для дальнейшего анализа или сохранения.

HTML:

divНикнеймСсылка

Если вы сами хотите разобраться в работе подобного скрипта и использовать этот навык для себя, то рекомендую обратить внимание на сервис https://jsfiddle.net/ , в котором удобно тренироваться и сохранять свои наработки.

Для того чтобы повторить этот скрипт у себя в редакторе, нужно всего лишь в окне html вставить код:

<p>HTML:<Br>
<textarea id="src" name="htmlsrc" cols="40" rows="5"></textarea>
</p>
<input type="submit" value="Отправить" onclick="parse();">
<div id="result">
<table><tbody id="table">
<tr><th>div</th><th>Никнейм</th><th>Ссылка</th></tr>
</tbody></table>
</div>

А в окне JavaScript следующее:

function parse() {
  var src = document.getElementById('src').value;
  var parser = new DOMParser();
	var htmlDoc = parser.parseFromString(src, 'text/html');
  
  var list = htmlDoc.getElementsByClassName("enpQJ");
  for (var i = 0; i<list.length; i++) { 
  	var list_a = list[i].getElementsByTagName("a");
  	var insta_title = list_a[0].getAttribute('title');
  	var insta_href = list_a[0].getAttribute('href');
   	var list_div = list[i].getElementsByTagName("div");
    var insta_div = list_div[1].innerHTML;

// добавление строки таблицы
		var tr = document.createElement('tr');
  	tr.innerHTML = '<td>'+insta_div+'</td><td>' + insta_title + '</td><td><a href="'+insta_href+'">'+insta_href+'</a></td>';
		document.getElementById("table").append(tr);
  }
}

Текст скрипта настолько мал, что разобраться в нем совсем не сложно. Только обращаю ваше внимание на сигнатуру класса «enpQJ», которая очевидно может измениться.

Запись опубликована в рубрике Без рубрики. Добавьте в закладки постоянную ссылку.

Добавить комментарий

Ваш e-mail не будет опубликован. Обязательные поля помечены *