Zipffördelning
1 Notis
En Zipffördelning är ett koncept inom statistisk lingvistik - och senare använt inom andra områden - som vanligen kallas Zipffördelning. George K. Zipf (1902-1950) som har givit namn åt begreppet hävdade aldrig att det var han som först formulerade att det finns ett närmast omvänt proportionellt avtagande antal värden mellan det vanligaste (ordet i ett språk) och det näst vanligaste och så vidare. Detta kan avbildas som figuren visar i en asymptotisk kurva. Se engelska Wikipedia för en matematisk beskrivningꜜ.
Svar 2 AI-dialog om likheter mellan en Zipfkurva, en asymptotisk kurva och exemplet uppslagsverk.
Omfattande studier har gjorts som verifierar att det finns en Zipffördelning inom alla språk inklusive ett skapat språk som esperanto. Kurvans lutning är något brantare för sidor på en större sajt på internet. Lars Melin har skrivit underhållande artikel om Zipfkurvor som Störtloppets algoritmerꜜ, en väfunnen metaforORD.
The Long tailꜜ (den långa svansen) är begrepp som myntades i början av 2000-talet av Chris Anderson som en period var chefredaktör för tidskriften Wired. Ett känt exempel från hans bok med den titeln är att nätbokhandeln Amazon.com kunde "lagerföra" och sälja ett mycket stort antal böcker där många bok bara såldes i ett fåtal exemplar. Andersons kurva har likheter med en Zipfkurva. Tankefiguren har möts av kritik av ekonomer som bland annat påpekat att försäljningen sammanlagt av "icke-storsäljare" på Amazon.com uppgick till cirka 30%.
Referenser
- Zipffördelning Wikipedia • 3 referenser
- Zipfs lag Wikipedia • 48 referenser | bibliografi
- Störtloppets algoritmer, (2021) Lars Melin, artikel i tidskriften Axess
- Long tail Wikipedia • 40 referenser
Skribent
Publicerades: 2023.08.26 Uppdaterades: 2023.09.08
2 AI-dialog
Fråga 1: Vad är relationen mellan en zipffördelning och en asymptotisk kurva?
En Zipf-fördelning och en asymptotisk kurva är två olika begrepp som relaterar till statistik och matematik på olika sätt. Låt mig förklara var och en separat och sedan diskutera eventuella samband mellan dem.
Zipf-fördelning:
Zipf-fördelningen är en särskild typ av sannolikhetsfördelning som beskriver frekvensen av förekomst av olika händelser i ett givet dataset. Den är uppkallad efter lingvisten George Zipf, som observerade att i många naturliga språk är frekvensen av ett ord omvänt proportionell mot dess rangordning. Med andra ord, det mest förekommande ordet förekommer ungefär dubbelt så ofta som det näst vanligaste ordet, tre gånger så ofta som det tredje vanligaste ordet, och så vidare. Zipf-fördelningen kan beskrivas med en matematisk formel som involverar en parameter k, som styr hur snabbt frekvensen avtar med rangordning.
Asymptotisk kurva:
En asymptotisk kurva är en kurva som närmar sig en linje eller en annan kurva när dess variabel når extremt stora eller små värden. I matematiken används begreppet "asymptot" för att beskriva detta beteende. Asymptotiska kurvor används ofta för att beskriva hur en funktion eller en fördelning beter sig när dess parametrar går mot extremvärden.
Relation:
Så här kan du koppla ihop dessa två begrepp: Zipf-fördelningen har en intressant egenskap när det gäller asymptoter. Om du tänker på en Zipf-fördelning där rangordningen går till oändligheten, kommer frekvensen av händelser att närma sig noll. Detta betyder att Zipf-fördelningen har en asymptotisk egenskap där frekvensen av händelser närmar sig noll när rangordningen går mot oändligheten.
Så, du kan säga att Zipf-fördelningen har en asymptotisk beteende där den närmar sig en horisontell asymptot (noll frekvens) när rangordningen av händelser går mot oändligheten. Detta är ett exempel på hur de två begreppen kan vara relaterade, åtminstone i den kontexten.
Fråga 2: Kan man säga att detta har en parallell i konceptet om "The long tail" för sålda böcker via Amazon.com och antalet visade artiklar i ett digitalt uppslagsverk?
Ja, du har helt rätt. Konceptet med Zipf-fördelningen och dess asymptotiska egenskaper kan liknas vid idéerna bakom "The Long Tail" när det gäller försäljning av böcker på Amazon.com och antalet visade artiklar i ett digitalt uppslagsverk.
"The Long Tail" är ett begrepp som populariserades av Chris Anderson i en artikel från 2004 och senare i en bok med samma namn. Det hänvisar till den observationen att i online-marknadsplatser som Amazon.com, Netflix och andra digitala plattformar är utbudet av produkter eller innehåll mycket större än i fysiska butiker. Det betyder att även om några produkter (de mest populära) fortfarande säljer mycket, kan de mindre populära produkterna tillsammans utgöra en betydande del av försäljningen när de säljs i tillräckligt stor volym. Detta skapar en "long tail" på grafen som representerar försäljningsfördelningen, där de mindre populära produkterna utgör den långa svansen.
Liknande koncept kan appliceras på antalet visade artiklar i ett digitalt uppslagsverk som Wikipedia. Här kan ett litet antal mycket populära artiklar (till exempel "Hund" eller "USA") dra en stor mängd trafik, men tillsammans kan de mindre populära artiklarna som täcker mer nischade ämnen också dra en betydande mängd trafik om de ses som en sammanhängande enhet.
Både "The Long Tail" och Zipf-fördelningen belyser idén om hur en relativt liten del av de mest populära objekten eller händelserna kan dominera den totala försäljningen eller uppmärksamheten, medan en mängd mindre populära objekt tillsammans kan ha en liknande eller till och med större påverkan. Detta resonemang liknar det asymptotiska beteendet hos Zipf-fördelningen där de minst frekventa händelserna närmar sig nollfrekvensen på en asymptot.
Skribent
Svar via ChatGPT-4 (version 3 aug. 23) 23.08.26. Accepterat av redaktionen i BiBB®.
Publicerades: 2023.08.26
Uppdaterades: ....
3 Story
Destinationsvärde och Ordvärde i ett uppslagsverk
På en stor sajt som Wikipedia och Amazon.com får själva volymen ett egenvärde tack vare att många sannolikt kommer att kunna hitta något som personen letar efter. Låt oss kalla detta "Destinationsvärde".
Men även sajter med betydligt färre "resultat" kan ha ett stort "Ordvärde" genom att oberoende av i vilket hav det befinner sig ge intressanta och relevanta svar. Läs mer om ordvärde och användbarhet.
Skribent
Publicerades: 2023.08.26 Uppdaterades: ....
Ditt intresse bidrar till nya ORD i BiBB.
Se Lista och Guide till nya ORD.
You know a lot, we may add a little®