AdsPower
AdsPower

Schraap in een mum van tijd productgegevens van Best Buy met deze twee methoden

By AdsPower||2,164 Views

Wilt u marktinzicht krijgen in elektronische producten in de VS en Canada? Best Buy is een gigant op het gebied van dergelijke producten en zou uw go-to-platform voor die inzichten moeten zijn.

Het scrapen van Best Buy kan echter een uitdaging zijn en vereist matige tot geavanceerde technische vaardigheden.

In deze handleiding laten we u zien hoe u de Best Buy-scraper kunt gebruiken om Best Buy-productgegevens te scrapen en hoe u Best Buy kunt scrapen met Python voor extra flexibiliteit.

Dus of u nu de voorkeur geeft aan no-code tools of uw eigen scripts schrijft, deze handleiding is speciaal voor u gemaakt.

Maar voordat we in de details van het scrapen duiken, moeten we eerst kijken wat de beste koop is voor scraping vanuit een juridisch oogpunt.

Is het legaal om Best Buy-producten te schrapen?

Best Buy-productenAlgemene voorwaarden verklaart: "U mag de inhoud, geheel of gedeeltelijk, niet kopiëren of schrapen". Deze regel is er voornamelijk op gericht om gegevens te beschermen die niet vrij beschikbaar zijn of waarvoor inloggen vereist is om toegang te krijgen.

Het is echter een ander verhaal als je gegevens over het Beste Koop-product verzamelt die openbaar zijn. Je doet dit meestal niet Er is expliciete toestemming nodig om Best Buy voor dit soort gegevens te scrapen, zolang u dit op een verantwoorde manier doet.

Hier zijn een paar dingen om in gedachten te houden:

  • Zorg ervoor dat u hun website niet overbelast met te veel verzoeken. Dit kan hun site vertragen of verstoren, waardoor Best Buy uw scraper blokkeert.

  • Gebruik de gegevens die u krijgt alleen op een legale en ethische manier. Misbruik van gegevens kan u in juridische problemen brengen.

Het gebruik van een Best Buy-scraper is niet illegaal als u zich aan deze regels houdt en alleen openbaar beschikbare gegevens verzamelt. Zorg er alleen voor dat u de gegevens zorgvuldig scrapt en correct gebruikt.

Dit voorkomt problemen en zorgt ervoor dat u verantwoord Best Buy koopt.

Hoe scrap je Best Buy?

In deze handleiding laten we je zien hoe je Best Buy-productgegevens kunt scrapen zonder hun servers te beschadigen en zonder je aan andere ethische beperkingen te houden.

We zullen twee manieren bespreken om Best Buy-gegevens te scrapen. Eén daarvan is een Best Buy-scraper zonder code voor degenen die geen Best Buy-gegevens hebben. Ik heb een achtergrond in programmeren en een andere die Python gebruikt om de beste koop te kopen die een gemiddelde programmeerkennis vereist.

1. Gebruik een Best Buy-scraper

Kant-en-klare scrapers zijn een geweldig hulpmiddel voor marketeers die websites willen scrapen, maar geen programmeervaardigheden hebben.

Er zijn veel uitstekende no-code scrapers online beschikbaar die in verschillende vormen verkrijgbaar zijn, zoals softwaretoepassingen, browserextensies of Webconsoles. We hebben voor deze tutorial de Parsehub-webscraper geselecteerd, waarmee we websites kunnen scrapen met behulp van de ingebouwde browser.

Dit maakt het erg handig voor gebruikers zonder technische achtergrond, omdat het scrapen met Parsehub slechts een paar muisklikken kost. Dat gezegd hebbende, laten we beginnen met het scrapen van Best Buy-productgegevens.

Stap 1: Download en installeer ParseHub

Ga eerst naar deParseHub-website, download het installatieprogramma voor uw besturingssysteem en installeer ParseHub op uw computer.

Na de installatie opent u ParseHub en voltooit u het registratieproces om een account aan te maken.

Schraap in een mum van tijd productgegevens van Best Buy met deze twee methoden

Stap 2: Een nieuw project instellen

Nadat u bent ingelogd bij ParseHub, klikt u op de knop 'Nieuw project'.

Schraap in een mum van tijd productgegevens van Best Buy met deze twee methoden


Voer in het nieuwe scherm de URL in van de categoriepagina met de beste koop die u wilt schrapen. We hebben de lijst met de categoriepagina's met de beste koop gebruikt voor
Computeraccessoiresvoor de demonstratie.

Schraap in een mum van tijd productgegevens van Best Buy met deze twee methoden

Druk nu op de knop "Project starten". Hiermee wordt de pagina in ParseHub geladen en voorbereid voor scraping.

Schraap in een mum van tijd productgegevens van Best Buy met deze twee methoden


Stap 3: Het project hernoemen

Hernoem de projectnaam zodat u het bestand in de toekomst gemakkelijk kunt herkennen tussen andere bestanden.

Schraap in een mum van tijd productgegevens van Best Buy met deze twee methoden

Geef het een relevante naam, zoals bestbuy_producten.

Schraap in een mum van tijd productgegevens van Best Buy met deze twee methoden


Stap 4: Selecteer de producttitels

Klik, terwijl de pagina geladen is, op de naam van het eerste vermelde product. Hierdoor wordt de productnaam groen gemarkeerd. De rest van de producttitels en alle scrapbare elementen worden geel.

Schraap in een mum van tijd productgegevens van Best Buy met deze twee methoden

Klik vervolgens op het tweede item in de lijst om automatisch alle vergelijkbare elementen op de pagina en maak ze groen.

Schraap in een mum van tijd productgegevens van Best Buy met deze twee methoden

In de zijbalk en de voorbeeldtabel ziet u dat de naam en URL van het product worden opgehaald. De groep heet echter 'selection1'.

Schraap in een mum van tijd productgegevens van Best Buy met deze twee methoden

U kunt deze naam in de zijbalk wijzigen naar iets relevants, zoals 'producten'. De kolomnamen in de voorbeeldtabel worden automatisch gewijzigd in 'productnaam' en 'producturl'.

Schraap in een mum van tijd productgegevens van Best Buy met deze twee methoden


Stap 5: Productprijzen extraheren

Om te specificeren welke andere productdetails u wilt scrapen, klikt u op het PLUS (+) pictogram naast uw productselectie en kiest u 'Relatieve selectie'.

Schraap in een mum van tijd productgegevens van Best Buy met deze twee methoden

Klik met de tool 'Relatieve selectie' op een productnaam en vervolgens op de bijbehorende prijs. Dit koppelt de twee elementen op alle producten en er verschijnt een pijl om deze verbinding aan te geven.

Schraap in een mum van tijd productgegevens van Best Buy met deze twee methoden

Geef dit nieuwe element in de zijbalk het label 'prijs'. Verwijder ook alle onnodige URL-opdrachten uit deze selectie, aangezien we geen prijs-URL's nodig hebben.

Schraap in een mum van tijd productgegevens van Best Buy met deze twee methoden


Stap 6: Gebruik relatieve selectie voor andere elementen

U kunt stap 4 herhalen en de functie voor relatieve selectie gebruiken om meer productdetails te scrapen, zoals beoordelingen en het aantal recensies.

Stap 7: De gegevens uitvoeren en exporteren

Zodra u al uw selecties (productnamen en prijzen) hebt ingesteld, klikt u op 'Gegevens ophalen' en kiest u de optie 'Uitvoeren'.

Schraap in een mum van tijd productgegevens van Best Buy met deze twee methoden

Schraap in een mum van tijd productgegevens van Best Buy met deze twee methoden


Nadat de run is voltooid, downloadt u de gegevens in uw gewenste formaat. Parsehub ondersteunt CSV-, Excel- en JSON-formaten.

Schraap in een mum van tijd productgegevens van Best Buy met deze twee methoden


2. Productgegevens van Best Buy scrapen met Python

Het gebruik van no-code tools om Best Buy te scrapen brengt enkele uitdagingen met zich mee. Uw Best Buy-scraper kan bijvoorbeeld geblokkeerd raken en u moet mogelijk de HTTP-aanvraag aanpassen met een aangepastegebruikeragentof gebruik proxy's om dit probleem te verhelpen.

Deze geavanceerde functies zijn echter vaak alleen beschikbaar voor premiumgebruikers van no-codetools.

Als alternatief kunt u websites scrapen door uw eigen code te schrijven. Programmeertalen zijn open-source en bieden meer aanpassingsmogelijkheden voor scraping-taken, zoals het aanpakken van fouten en blokkades.

Bovendien hoeft u geen expert te zijn in coderen om dit te kunnen doen; gemiddelde vaardigheden zijn voldoende. Dus, als u over de vereiste vaardigheden beschikt, blijf dan bij ons en volg deze stappen om de beste koop te vinden.

Stap 1: Python installeren

Zorg er eerst voor dat Python op uw computer is geïnstalleerd. U kunt de nieuwste versie downloaden en installeren vanaf deofficiële Python-website.

Stap 2: Essentiële bibliotheken importeren

Je moet verschillende Python-bibliotheken importeren die webscraping en gegevensverwerking vergemakkelijken. Hier is de code om verzoeken te importeren voor HTTP-verzoeken, BeautifulSoup van BS4 voor het parseren van HTML en Pandas voor gegevensverwerking:

importeren verzoeken
van bs4 importeren BeautifulSoup
import pandas as pd


Stap 3: De payload structureren

Stel de payload in voor uw POST-verzoek. Dit omvat het specificeren van de bron, de URL van de Best Buy-pagina die u wilt scrapen en de geografische locatie voor de verzoekcontext:

payload = {
'bron': 'universele_e-commerce',
'url': 'https://www.bestbuy.ca/nl-nl/categorie/computers-tablets/20001',
'geo_location': 'Verenigde Staten',
}


Stap 4: HTTP-verzoek verzenden

Gebruik de requests-bibliotheek om een POST-verzoek naar de server te sturen. Vervang 'USERNAME' en 'PASSWORD' door de API-referenties van uw scraper om het verzoek te verifiëren.

response = requests.request(
'POST',
'{voer uw aanvraaglink in}',
auth=('GEBRUIKERSNAAM', 'WACHTWOORD'),
json=payload,
)


Stap 5: De HTML-inhoud opslaan

Zodra u de HTML-inhoud van Best Buy ontvangt, slaat u deze op in een bestand. Dit bestand wordt gebruikt om productgegevens van Best Buy te extraheren:

html_content = response.json()['resultaten'][0]['inhoud']
met open('bestbuy_computers_tablets.html', 'w') as f:
f.write(html_content)


Stap 6: De HTML parseren

Gebruik BeautifulSoup om de opgeslagen HTML-inhoud te parseren. Hiermee kunt u specifieke gegevens identificeren en extraheren, zoals producttitels en prijzen:

soep = BeautifulSoup(html_content,'html.parser')


Stap 7: Productgegevens extraheren

Loop door de geparseerde HTML om productdetails van Best Buy te vinden en op te slaan. Gebruik de klassenamen op basis van de daadwerkelijke HTML-structuur van de Best Buy-pagina:

producten = []
voor product in soup.find_all('div', class_='sku-item'):
titel = product.find('h4', class_='sku-header').get_text(strip=True) als product.find('h4', class_='sku-header') anders 'Geen titel'
prijs = product.find('div', class_='priceView-customer-price').span.get_text(strip=True) als product.find('div', class_='priceView-customer-price') anders 'Geen prijs'
producten.append({'Titel': titel, 'Prijs': price})


Stap 8: Exporteren naar CSV

Converteer de lijst met woordenboeken met productgegevens van Best Buy naar een DataFrame en exporteer deze als een CSV-bestand. Dit bestand bevat alle verzamelde productgegevens van Best Buy in een gestructureerde indeling:

df=pd.DataFrame(producten)
df.to_csv('bestbuy_computers_tablets.csv', index=False)


Gebruik AdsPower voor extra bescherming!

Het is niet ongebruikelijk dat scrapers van Best Buy lege bestanden retourneren na het scrapen. Dit kan gebeuren als de servers van Best Buy uw scraper blokkeren, deze als bot identificeren, of omdat Best Buy voornamelijk actief is in de VS en Canada en verzoeken uit andere regio's kan weigeren.

Het aanpakken van deze problemen kan complex zijn en het kost veel tijd en vaardigheden om vanaf nul oplossingen te coderen.

In plaats van het wiel opnieuw uit te vinden, kunt u hulpmiddelen gebruiken die zoveel moeite hebben gekost en uw leven gemakkelijker hebben gemaakt. Maak kennis metAdsPower, een anti-detectiebrowser met geavanceerde maatregelen om problemen met scraping aan te pakken. Het maakt gebruik van technieken zoals vingerafdrukspoofing ng, aanvraagvertragingen en proxy-rotaties om u te helpen bij het probleemloos zoeken naar Best Buy- en e-commerceplatforms.

AdsPower heeft een gratis versie en als u meer functies nodig hebt, onzebetaalde abonnementenbeginnen bij slechts $ 5,40 per maand.

DusDownload AdsPowervandaag en schraap productgegevens van de beste koop zonder dat het je moeite kost.

AdsPower

Beste multi-loginbrowser voor elke branche

Schraap in een mum van tijd productgegevens van Best Buy met deze twee methoden

Mensen lezen ook