AdsPower
AdsPower

Cum să extragi date de pe Instagram? 3 moduri de a profita la maximum de eforturile tale de extragere a datelor

By AdsPower||9,309 Views

Aruncă o privire rapidă

Use the simple, legal methods in this article to scrape Instagram data and boost your marketing. Stay undetected with AdsPower's antidetect features—start now!

With over 1.3 billion users, Instagram is a goldmine of valuable data for businesses to use for market research, lead generation, and performance monitoring. But scraping Instagram to get this data is the tricky part.

The procedure is not straightforward and has a lot of complexities either due to Instagram policies or technical ambiguities.

This guide answers how to scrape Instagram by introducing three ways involving low and heavy code methods and a no-code method.

Este legală extragerea de date de pe Instagram?

Răspunsul la întrebarea „Este legală extragerea de date de pe Instagram?” este da și nu în același timp, deoarece se reduce la tipul de date pe care le extragi. Dacă vrei să extragi date de pe Instagram pentru date disponibile public, răspunsul este da.

Dar dacă extragi date private de pe Instagram care necesită o autentificare pe Instagram, atunci acest lucru este explicit interzis și te-ai putea confrunta cu suspendarea contului și, în cel mai rău caz, cu acțiuni în justiție. Dar chiar și pentru datele publice, trebuie să asiguri o metodă legală de extragere.

Pentru a extrage date legale de pe Instagram, poți utiliza API-urile furnizate de Instagram. Acestea includ API-ul Instagram Graph și API-ul Instagram Basic Display.

API-ul Graph vă permite să gestionați și să extrageți date despre conturile de afaceri și de creatori. În timp ce API-ul Basic Display vă oferă acces doar pentru citire la informațiile de bază despre utilizatori. Ambele API-uri respectă politicile Instagram privind scraping-ul, așadar scraping-ul de pe Instagram folosindu-le este complet legal.

Cu toate acestea, dacă utilizați API-uri nepublice sau ilicite, ceea ce înseamnă că accesați platforma fără permisiune prealabilă și adesea deghizați scraper-ul pentru a apărea ca un utilizator obișnuit, atunci acest lucru se încadrează în categoria scraping-ului neautorizat și încalcă drepturile InstagramTermeni și condiții.

Așadar, înainte de a începe să extragi date de pe Instagram, fă un pas înapoi și gândește-te „Permite Instagram extragerea de date?” și asigură-te că ești atent în timp ce faci asta.

Ce date de pe Instagram poți extrage cu ușurință?

Înainte de a vă arăta cum să extrageți date de pe Instagram, haideți să descoperim mai întâi ce date pot fi extrase legal de pe platformă. Extragerea legală de date pe Instagram vă poate oferi acces la aceste trei categorii de date:

  • Hashtag-uri: Puteți obține fotografiile și videoclipurile cu cele mai bune performanțe sau recente, care sunt etichetate cu un hashtag specific în legenda lor.

  • Profiluri:Puteți obține date de profil, cum ar fi postări, număr de conținut media și număr de urmăritori/urmăritori.

  • Postări: Puteți obține valori precum numărul de comentarii, numărul de aprecieri, ID-ul profilului, data publicării și adresa URL.

3 metode de a extrage date de pe Instagram

Iată trei metode de a extrage date de pe Instagram. Alege-o pe cea care se potrivește nevoilor și resurselor tale:

Extragerea datelor de pe Instagram folosind API-ul Instagram

Iată un ghid pas cu pas despre cum să extragi date de pe Instagram, dar asigură-te că îndeplinești mai întâi următoarele cerințe:

  • Un cont de Instagram pentru afaceri/creator

  • O pagină de Facebook legată de contul de Instagram pentru afaceri/creator

  • Un cont de dezvoltator Facebook pentru a utiliza API-ul Instagram Graph

  • O configurație înregistrată a aplicației Facebook cu setări minime

După ce ați terminat cu aceste cerințe preliminare, următoarele etape arată astfel.

Adăugați funcționalitatea de conectare la Facebook:

Navigați la tabloul de bord al aplicației Facebook și faceți clic pe butonul „Produs +” din panoul din partea stângă a ferestrei. De acolo, adăugați produsul de conectare la Facebook. Deocamdată, nu modificați setările pentru acest produs și lăsați-le la setările implicite.

Apoi, va trebui să implementați autentificarea Facebook în aplicația dvs. cu ajutorul Documentația de conectare la Facebook și asigurați-vă că procedura de conectare solicită aceste două permisiuni de bază:

Cum să extragi date de pe Instagram? 3 moduri de a profita la maximum de eforturile tale de extragere a datelor

Generează token de acces:

Efectuarea acțiunilor din tabloul de bord al aplicației pe contul de Instagram necesită un token de acces al utilizatorului. În partea dreaptă a paginii tabloului de bord, deschideUtilizator sau Pagină și selectați Obțineți jeton de acces utilizator.

Va apărea o fereastră pop-up care vă va informa că o aplicație (în acest caz, aplicația dvs.) solicită permisiunile menționate mai sus. Pur și simplu apăsați butonul Continuare sau OK și veți primi Tokenul de acces al utilizatorului în câmpul Token de acces din tabloul de bord.

Cum să extragi date de pe Instagram? 3 moduri de a profita la maximum de eforturile tale de extragere a datelor

Acum, folosind Tokenul de Acces al Utilizatorului, vom executa câteva interogări de bază asupra contului de Instagram.

1. Obțineți ID-ul Paginii de Facebook:

Mai întâi, avem nevoie de ID-ul Paginii de Facebook conectate la contul de Instagram Business. Pentru aceasta, executați următoarea interogare Get în tabloul de bord.

"https://graph.facebook.com/v19.0/me/accounts?access_token={access-token}"

Aceasta va returna numele și ID-ul Paginilor de Facebook aparținând utilizatorului de Facebook. Rezultatul va arăta astfel.

{
"date":[
{
"access_token":"EAAJjmJ...",
"categorie":"Pagina aplicației",
"listă_categorii":[
{
"id":"2301",
"nume":"Pagina aplicației"

],
"nume":"Metricsaurus",
"id":"134895793791914",
"sarcini":[
"ANALIZEAZĂ",
"PUBLICITATE",
"MODERAT",
"CREAȚI_CONȚINUT",
"GESTIONARE"
]

]
}span>


Copiați ID-ul paginii conectate la contul de Instagram Business.

2. Obțineți ID-ul contului de Instagram Business:

Folosind ID-ul Facebook, introduceți următorul script în bara de comenzi și apăsați pe Trimitere.

134895793791914? câmpuri=cont_de_afaceri_instagram

Veți obține următorul rezultat.

{
"instagram_business_account":{
"id":"17841405822304914"//ID utilizator IG conectat
},
"id":"134895793791914"//ID-ul paginii de Facebook
}span>


3. Obțineți obiectele media ale contului de Instagram:

Copiați ID-ul Instagram din rezultat și executați următorul script pentru a obține ID-urile tuturor poveștilor postate în prezent pe contul de Instagram Business.

17841405822304914/povești

Ieșirea va conține un ID pentru fiecare poveste.

{
"date":[
{
"id":"17918195224117851"
},
{
"id":"17895695668004550"
},
{
"id":"17899305451014820"
},
{
"id":"17896450804038745"
},
{
"id":"17881042411086627"
},
{
"id":"17869102915168123"

]

Acesta a fost doar un exemplu. Folosind API-ul Instagram Graph, puteți obține și alte informații, cum ar fi metadatele unui utilizator Instagram, și puteți efectua cercetări asupra hashtag-urilor.

Acum să trecem la o altă modalitate de a extrage date de pe Instagram.

Extragerea de date de pe Instagram folosind No Code Cloud Scrapper

Pentru cei fără cunoștințe de programare, metoda de mai sus poate fi dificil de înțeles, darămite de executat. Dar nu vă faceți griji. Există instrumente de extragere a datelor de pe Instagram care își fac treaba fără a necesita cod.

Iată cum puteți extrage date de pe Instagram folosind unul dintre aceste instrumente numiteApify.

Accesați pagina Apify Scraper de Instagram:

Deschideți pagina Apify Scraper de Instagram și faceți clic peButonul „Încearcă gratuit”..


Cum să extragi date de pe Instagram? 3 moduri de a profita la maximum de eforturile tale de extragere a datelor

Înregistrează-te pe Apify folosind adresa ta de e-mail sau conturile Google sau Github. Aceasta te va duce la Consola Apify, unde are loc adevărata extragere de date de pe Instagram.

Colectați adrese URL Instagram țintă:

Folosind aplicația sau site-ul web Instagram, colectați toate adresele URL de profil ale conturilor Instagram pe care doriți să le extrageți. În consola Apify, lipiți toate aceste adrese URL în câmpurile de introducere date, una câte una. Pentru a le introduce pe toate odată, puteți face clic pe butonul Editare în bloc.

Cum să extragi date de pe Instagram? 3 moduri de a profita la maximum de eforturile tale de extragere a datelor

Apify oferă trei opțiuni de extragere a datelor (scraping) pentru URL-urile furnizate, puteți extrage postări și comentarii sau puteți obține diferite detalii din profiluri.

Faceți clic pe Salvare și Pornire:

Lăsați restul setărilor neschimbate și apăsați pe Salvare și Pornire pentru a rula scraper-ul. Rezultatul va fi sub forma unui tabel care conține rânduri egale cu numărul de adrese URL de profil pe care le-ați furnizat, cu mai multe coloane care conțin metadate ale profilului, cum ar fi biografia, numărul de urmăritori, numărul de postări, numărul de reel-uri, ID-ul contului și starea de verificare, pentru a numi doar câteva.

Cum să extragi date de pe Instagram? 3 moduri de a profita la maximum de eforturile tale de extragere a datelor

Stocați rezultatele:

Acum apăsați butonul Exportă rezultatele și selectați formatul de fișier dorit din fereastra pop-up. De asemenea, puteți curăța datele selectând sau omițând câmpuri de care nu aveți nevoie. După aceea, puteți descărca rezultatele, le puteți vizualiza într-o filă nouă sau le puteți partaja printr-un link.

Cum să extragi date de pe Instagram? 3 moduri de a profita la maximum de eforturile tale de extragere a datelor

Extragerea de date de pe Instagram folosind un limbaj de programare

Construirea propriului scraper Instagram poate fi cea mai eficientă soluție dacă cerințele tale sunt atipice și ai cunoștințe solide de programare sau ai un dezvoltator în echipă. Poți face asta folosind orice limbaj de programare cuplat cu un framework de scraping web.

Acest ghid demonstrează cum să extragi date de pe Instagram folosind Python și Selenium, un framework de automatizare a browserelor.

Importă biblioteci esențiale:

Pentru început, importați biblioteci de bază, inclusiv Selenium, driverul său web și Selenium-Stealth, pentru a preveni detectarea.

dinseleniuimportdriver web
dinselenium.webdriver.common.byimportDe
dinimprimareimportareimprimare
importarejson
dinselenium_stealthimportstealth

Biblioteca pprint ne va ajuta să imprimăm rezultatul cu grijă pentru o lizibilitate sporită.

Colectați nume de utilizator Instagram:

Fă o listă și adaugă numele de utilizator ale profilurilor Instagram pe care le vizezi.

usernames=["natureismetal","miteuniversity","samstailor","therock"]
proxy="server:port"
output={}

Variabila de ieșire este un dicționar pe care îl vom folosi pentru a stoca rezultatele.

Definește funcția principală:

Funcția principală va parcurge lista de nume de utilizator pe rând și va apela funcția scrape pentru fiecare nume de utilizator.

defprincipal():
pentrunume de utilizatorînnume de utilizator:
scrape(numeutilizator)


Definește o funcție pentru a gestiona setările browserului:

Această funcție va ajusta setările browserului înainte de fiecare solicitare de scraping pentru a adăuga anonimat și a evita detectarea de către Instagram. Aceste modificări includ rotația proxy-urilor, configurarea setărilor Selenium-Stealth și crearea unui agent utilizator artificial.

defprepare_browser():
chrome_options=webdriver.ChromeOptions()
chrome_options.add_argument(f'--proxy-server={proxy}')
chrome_options.add_argument("start-maximized")
chrome_options.add_experimental_option("excludeSwitches",["enable-automation"])
chrome_options.add_experimental_option('useAutomationExtension',False)
driver=webdriver.Chrome(options=chrome_options)
stealth(driver,
'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, similar cu Gecko) Chrome/83.0.4103.53 Safari/537.36',
languages=["en-US","en"],
vendor="Google Inc.",
platform="Win32",
webgl_vendor="Intel Inc.",
renderer="Motorul Intel Iris OpenGL",
fix_hairline=Fals,
run_on_insecure_origins=False,
)
returndriver


Definește o funcție pentru Scraping:

Funcția scrape() apelată în funcția principală preia un singur nume de utilizator Instagram ca argument și creează un endpoint de profil pe care îl vom folosi pentru a trimite o solicitare utilizând browserul Chrome, efectuată prin intermediul funcției prepare_browser().

De asemenea, vom verifica starea solicitării. Dacă solicitarea dvs. a fost redirecționată către pagina de conectare, aceasta înseamnă că solicitarea a eșuat. Întrucât, dacă nu exista un șir de autentificare, cererea a avut succes, iar rezultatul va fi analizat ca JSON și trimis funcției parse_data() împreună cu numele de utilizator.

defrăzuire(nume de utilizator):


url=f'https://instagram.com/{nume de utilizator}/? __a=1&__d=dis'
chrome=prepare_browser()
chrome.get(url)
print(f"Se încearcă:{chrome.current_url}")


dacă"autentificare"închrome.current_url:
înimprimare("Autentificare eșuată/redirecționare eșuată")
chrome.quit()

else:
print("Succes")
resp_body=chrome.find_element(By.TAG_NAME,"body").text
data_json=json.loads(resp_body)
user_data=data_json['graphql']['utilizator']
... data-type="text">chrome.quit()


Definiți funcția parse_data():

Această funcție analizează datele JSON din argumentul user_data pentru a obține câmpul de date dorit. În acest exemplu, căutăm prin razuire numele complet al utilizatorului, categoria contului, numărul de urmăritori și descrierile postărilor.

defparse_data(nume de utilizator, date_utilizator):
legende=[]


iflen(user_data['edge_owner_to_timeline_media']['edges'])> 0:
  pentrunodîn user_data['proprietar_margine_la_mediul_cronologiei']['margini']:
iflen(node['node']['edge_media_to_caption']['edges']) 0:
Dacă'nod''nod']['edge_media_to_caption']['margini'][0]['nod']['text']:
captions.append(

node['node']['edge_media_to_caption']['margini'][0]['nod']['text'])

output[numeutilizator]={
'nume': user_data['nume_full'],
'categorie': user_data['nume_categorie'],
'urmăritori': user_data['edge_followed_by']['count'],
'postări': legende,


Scrieți codul driverului:

Codul driverului declanșează procesul de scraping, extrage datele în variabila de ieșire și apelează funcția pprint() pentru a le afișa într-un mod atractiv.

dacă__name__=='__main__':
main()
pprint(output)


Ocoliți detectarea cu AdsPower Antidetect Browser

Instagram este strict în ceea ce privește extragerea de informații și oferă acces foarte limitat la datele publice de pe platforma sa. Acestea includ informații de bază, cum ar fi ID-ul profilului, numărul de urmăritori, aprecierile și numărul de comentarii. Săparea mai profundă de atât necesită o autentificare, ceea ce contravine politicilor Instagram și poate duce la suspendarea contului.

Aici este utilAdsPower, ajutându-vă să mențineți un profil scăzut atunci când extrageți date de pe Instagram care ar putea avea șansa de a încălca politicile Instagram.AdsPower folosește tehnici antidetecție, cum ar fi rotația IP-urilor și limitarea ratei, pentru a evita măsurile anti-scraping.


Cum să extragi date de pe Instagram? 3 moduri de a profita la maximum de eforturile tale de extragere a datelor

Așadar, data viitoare când extragi date de pe Instagram folosind un instrument fără cod sau API-uri neoficiale de pe Instagram, asigură-te că folosește funcția antidetecție AdsPower pentru browser pentru a ocoli detectarea.

https://share.adspower.net/blogcta

Concluzie

Instagram permite extragerea datelor doar pentru datele disponibile public pe platforma sa, pentru care oferă două API-uri. Însă aceste API-uri oferă un nivel foarte simplu de extragere a datelor, fără a vă permite să extrageți date de pe Instagram care sunt cu adevărat relevante.

Aceasta ne lasă cu scrapere web terțe sau cu crearea propriului scraper folosind limbaje de programare. Cu toate acestea, scraparea Instagramului folosind aceste metode neoficiale are șanse de detectare, așa că asigurați-vă că utilizați browserul antidetect AdsPower pentru o protecție suplimentară.

AdsPower

Cel mai bun browser cu autentificare multiplă pentru orice industrie

Cum să extragi date de pe Instagram? 3 moduri de a profita la maximum de eforturile tale de extragere a datelor

Oamenii citesc și