Chống lạm dụng hệ số Gini

Rate this post


2021 ngày 29 tháng 7
Xem tất cả bài viết
Chống lạm dụng hệ số Gini

Đặc biệt cảm ơn Barnabe Monnot và Tina Zhen đã phản hồi và đánh giá

Hệ số Gini (còn gọi là chỉ số Gini) cho đến nay là thước đo bất bình đẳng phổ biến và được biết đến rộng rãi nhất, thường được sử dụng để đo lường sự bất bình đẳng về thu nhập hoặc của cải ở một số quốc gia, vùng lãnh thổ hoặc cộng đồng khác. Nó phổ biến vì nó dễ hiểu, với định nghĩa toán học có thể dễ dàng hình dung trên biểu đồ.

Tuy nhiên, như người ta có thể mong đợi từ bất kỳ kế hoạch nào cố gắng giảm bất bình đẳng xuống một con số duy nhất, hệ số Gini cũng có giới hạn của nó. Điều này đúng ngay cả trong bối cảnh ban đầu là đo lường sự bất bình đẳng về thu nhập và giàu nghèo ở các quốc gia, nhưng nó càng trở nên đúng hơn khi hệ số Gini được ghép vào các bối cảnh khác (cụ thể là: tiền điện tử). Trong bài đăng này, tôi sẽ nói về một số giới hạn của hệ số Gini và đề xuất một số giải pháp thay thế.

Hệ số Gini là gì?

Hệ số Gini là thước đo sự bất bình đẳng do Corrado Gini đưa ra vào năm 1912. Hệ số này thường được sử dụng để đo lường sự bất bình đẳng về thu nhập và của cải của các quốc gia, mặc dù nó cũng ngày càng được sử dụng nhiều hơn trong các bối cảnh khác.

Có hai định nghĩa tương đương về hệ số Gini:

Định nghĩa vùng trên đường cong: vẽ đồ thị hàm số \(f(p)\) bằng với phần tổng thu nhập mà bộ phận dân số có thu nhập thấp nhất kiếm được (ví dụ: \(f(0,1)\) là phần của tổng thu nhập mà 10% thu nhập thấp nhất kiếm được. Hệ số Gini là diện tích giữa đường cong đó và \(y=x\) dòng, như một phần của toàn bộ tam giác:



Định nghĩa chênh lệch trung bình: hệ số Gini bằng một nửa chênh lệch thu nhập trung bình giữa tất cả các cặp cá nhân có thể có, chia cho thu nhập trung bình.

Ví dụ: trong biểu đồ ví dụ trên, bốn thu nhập là [1, 2, 4, 8]vì vậy 16 sự khác biệt có thể là [0, 1, 3, 7, 1, 0, 2, 6, 3, 2, 0, 4, 7, 6, 4, 0]. Do đó, chênh lệch trung bình là 2,875 và thu nhập trung bình là 3,75, vì vậy Gini = \(\frac{2,875}{2 * 3,75} \xấp xỉ 0,3833\).

Nó chỉ ra rằng cả hai tương đương về mặt toán học (chứng minh đây là một bài tập cho người đọc)!

Có gì sai với hệ số Gini?

Hệ số Gini hấp dẫn vì đây là một thống kê khá đơn giản và dễ hiểu. nó có thể không nhìn đơn giản, nhưng tin tôi đi, gần như mọi thứ trong số liệu thống kê liên quan đến các quần thể có kích thước tùy ý đều tệ như vậy, và thường còn tệ hơn nhiều. Ở đây, hãy nhìn vào công thức của một thứ cơ bản như độ lệch chuẩn:

\(\sigma = \frac{\sum_{i=1}^n x_i^2}{n} – (\frac{\sum_{i=1}^n x_i}{n})^2\)

Và đây là Gini:

\(G = \frac{2 * \sum_{i=1}^ni*x_i}{n * \sum_{i=1}^n x_i} – \frac{n+1}{n}\)

Nó thực sự khá thuần hóa, tôi hứa!

Vì vậy, những gì sai với nó? Chà, có rất nhiều điều không ổn với nó, và người ta đã viết rất nhiều bài báo về các vấn đề khác nhau với hệ số Gini. Trong bài viết này, tôi sẽ tập trung vào một vấn đề cụ thể mà tôi nghĩ là chưa được thảo luận đầy đủ về Gini nói chung, nhưng vấn đề đó có liên quan đặc biệt đến việc phân tích sự bất bình đẳng trong các cộng đồng internet như chuỗi khối. Hệ số Gini kết hợp với nhau thành một chỉ số bất bình đẳng duy nhất, hai vấn đề thực sự trông khá khác nhau: đau khổ do thiếu nguồn lực và tập trung quyền lực.

Để hiểu rõ hơn về sự khác biệt giữa hai vấn đề, chúng ta hãy xem xét hai điều lạc hậu:

  • Chứng loạn thị A: một nửa dân số chia đều tất cả tài nguyên, những người khác không có
  • loạn thị giác B: một người có một nửa tài nguyên, những người khác chia đều nửa còn lại

Dưới đây là các đường cong Lorenz (các biểu đồ ưa thích như chúng ta đã thấy ở trên) cho cả hai chứng loạn thị:



Rõ ràng, cả hai nơi lạc hậu đó đều không phải là nơi tốt để sống. Nhưng chúng không phải là những nơi tốt đẹp để sống theo những cách rất khác nhau. Dystopia A mang đến cho mỗi cư dân một lượt lật đồng xu giữa nạn đói hàng loạt khủng khiếp không thể tưởng tượng được nếu họ kết thúc ở nửa bên trái trên phân phối và sự hài hòa theo chủ nghĩa quân bình nếu họ kết thúc ở nửa bên phải. Nếu bạn là Thanos, bạn có thể thực sự thích nó! Nếu không, bạn nên tránh bằng lực mạnh nhất. Mặt khác, Dystopia B giống với Brave New World: mọi người đều có cuộc sống tốt đẹp (ít nhất là vào thời điểm khi tài nguyên của mọi người bị lấy đi), nhưng với cái giá đắt là cấu trúc quyền lực cực kỳ phi dân chủ nơi bạn ‘ d tốt hơn hy vọng bạn có một lớp phủ tốt. Nếu bạn là Curtis Yarvin, bạn có thể thực sự thích nó! Nếu bạn không, nó cũng rất đáng để tránh.

Hai vấn đề này đủ khác nhau để chúng đáng được phân tích và đo lường một cách riêng biệt. Và sự khác biệt này không chỉ là lý thuyết. Dưới đây là biểu đồ cho thấy tỷ lệ phần trăm trong tổng thu nhập kiếm được của 20% dưới cùng (một đại diện tốt để tránh chứng loạn thị A) so với phần tổng thu nhập kiếm được bởi 1% cao nhất (một đại diện tốt cho việc ở gần chứng loạn thị B):


Nguồn: https://data.worldbank.org/indicator/SI.DST.FRST.20 (kết hợp dữ liệu năm 2015 và 2016) và http://hdr.undp.org/en/indicators/186106.

Cả hai có mối tương quan rõ ràng (hệ số -0,62), nhưng còn rất xa so với mối tương quan hoàn hảo (các nhà thống kê cấp cao rõ ràng coi 0,7 là ngưỡng thấp hơn để được “tương quan cao” và chúng tôi thậm chí còn ở dưới mức đó). Có một chiều thứ hai thú vị đối với biểu đồ có thể được phân tích – sự khác biệt giữa một quốc gia nơi 1% hàng đầu kiếm được 20% tổng thu nhập và 20% dưới cùng kiếm được 3% và một quốc gia nơi 1% hàng đầu kiếm được 20% và 20% dưới cùng kiếm được 7%? Than ôi, một cuộc khám phá như vậy tốt nhất là dành cho những nhà khám phá văn hóa và dữ liệu dám nghĩ dám làm khác có nhiều kinh nghiệm hơn tôi.

Tại sao Gini là hết sức có vấn đề trong các cộng đồng phi địa lý (ví dụ: cộng đồng internet/tiền điện tử)

Sự tập trung của cải trong không gian chuỗi khối nói riêng là một vấn đề quan trọng và đó là một vấn đề đáng để đo lường và hiểu rõ. Điều quan trọng đối với toàn bộ không gian blockchain, vì nhiều người (và các phiên điều trần của thượng viện Hoa Kỳ) đang cố gắng tìm hiểu xem tiền điện tử thực sự chống chủ nghĩa tinh hoa ở mức độ nào và nó chỉ thay thế giới tinh hoa cũ bằng những người mới ở mức độ nào. Nó cũng quan trọng khi so sánh các loại tiền điện tử khác nhau với nhau.

Chia sẻ số tiền được phân bổ rõ ràng cho những người trong cuộc cụ thể trong nguồn cung ban đầu của tiền điện tử là một loại bất bình đẳng. Lưu ý rằng dữ liệu Ethereum hơi sai: tỷ lệ chia sẻ nội bộ và nền tảng phải là 12,3% và 4,2%, không phải 15% và 5%.

Với mức độ lo ngại về những vấn đề này, không có gì đáng ngạc nhiên khi nhiều người đã thử tính toán các chỉ số Gini của tiền điện tử:

Và thậm chí trước đó, chúng tôi đã phải đối phó với bài báo giật gân này từ năm 2014:



Ngoài những sai lầm đơn giản về phương pháp luận (thường là lẫn lộn thu nhập với bất bình đẳng giàu nghèo, lẫn lộn người dùng với tài khoản hoặc cả hai) mà những phân tích như vậy mắc phải khá thường xuyên, còn có một vấn đề sâu sắc và tế nhị khi sử dụng hệ số Gini để tạo ra những loại này phép so sánh. Vấn đề nằm ở sự khác biệt chính giữa các cộng đồng địa lý điển hình (ví dụ: thành phố, quốc gia) và cộng đồng internet điển hình (ví dụ: chuỗi khối):

Một cư dân điển hình của một cộng đồng địa lý dành phần lớn thời gian và nguồn lực của họ trong cộng đồng đó, và do đó, sự bất bình đẳng được đo lường trong một cộng đồng địa lý phản ánh sự bất bình đẳng trong tổng số nguồn lực sẵn có cho mọi người. Nhưng trong một cộng đồng internet, sự bất bình đẳng được đo lường có thể đến từ hai nguồn: (i) sự bất bình đẳng về tổng nguồn lực sẵn có cho những người tham gia khác nhau và (ii) sự bất bình đẳng về Mức độ quan tâm trong việc tham gia vào cộng đồng.

Một người trung bình có 15 đô la tiền pháp định là người nghèo và đang bỏ lỡ khả năng có một cuộc sống tốt đẹp. Một người bình thường có 15 đô la tiền điện tử là một tay chơi khăm đã mở ví một lần cho vui. Bất bình đẳng về mức độ quan tâm là một điều lành mạnh; mọi cộng đồng đều có những người đam mê và những người hâm mộ cuồng nhiệt toàn thời gian của nó không có sự sống. Vì vậy, nếu một loại tiền điện tử có hệ số Gini rất cao, nhưng hóa ra phần lớn sự bất bình đẳng này xuất phát từ sự bất bình đẳng về mức độ quan tâm, thì con số này chỉ ra một thực tế ít đáng sợ hơn nhiều so với những gì tiêu đề ngụ ý.

Tiền điện tử, ngay cả những loại tiền hóa ra có tính đa tài cao, sẽ không biến bất kỳ nơi nào trên thế giới thành bất kỳ thứ gì gần với tình trạng loạn thị A. Nhưng các loại tiền điện tử được phân phối kém có thể trông giống như tình trạng loạn thị B, một vấn đề phức tạp nếu sử dụng quản trị bỏ phiếu bằng tiền xu để tạo ra quyết định giao thức. Do đó, để phát hiện các vấn đề mà cộng đồng tiền điện tử lo lắng nhất, chúng tôi muốn có một số liệu nắm bắt mức độ gần với dystopia B một cách cụ thể hơn.

Một giải pháp thay thế: đo lường riêng vấn đề loạn thị A và loạn thị B

Một cách tiếp cận khác để đo lường sự bất bình đẳng liên quan đến việc ước tính trực tiếp sự đau khổ do các nguồn tài nguyên được phân phối không đồng đều (nghĩa là các vấn đề “loạn thị giác A”). Đầu tiên, hãy bắt đầu với một số chức năng tiện ích đại diện cho giá trị của việc có một số tiền nhất định. \(log(x)\) là phổ biến, bởi vì nó nắm bắt được ước tính gần đúng hấp dẫn về mặt trực giác rằng việc tăng gấp đôi thu nhập của một người gần như hữu ích ở mọi cấp độ: tăng từ 10.000 đô la lên 20.000 đô la sẽ bổ sung cùng một tiện ích như tăng từ 5.000 đô la lên 10.000 đô la hoặc từ 40.000 đô la lên 80.000 đô la). Sau đó, điểm số là vấn đề đo lường mức độ thỏa dụng bị mất so với việc mọi người chỉ có thu nhập trung bình:

\(log(\frac{\sum_{i=1}^n x_i}{n}) – \frac{\sum_{i=1}^n log(x_i)}{n}\)

Thuật ngữ đầu tiên (log-of-average) là tiện ích mà mọi người sẽ có nếu tiền được phân phối lại hoàn hảo, vì vậy mọi người đều kiếm được thu nhập trung bình. Thuật ngữ thứ hai (trung bình của nhật ký) là tiện ích trung bình trong nền kinh tế đó ngày nay. Sự khác biệt thể hiện tiện ích bị mất do bất bình đẳng, nếu bạn xem xét các nguồn tài nguyên một cách hẹp hòi như một thứ được sử dụng cho tiêu dùng cá nhân. Có nhiều cách khác để xác định công thức này, nhưng cuối cùng chúng lại gần tương đương (ví dụ: bài báo năm 1969 của Anthony Atkinson đã đề xuất một thước đo “mức thu nhập tương đương được phân bổ đều”, trong đó, \(U(x) = log(x)\) chỉ là một hàm đơn điệu của hàm trên và chỉ số Theil L hoàn toàn tương đương về mặt toán học với công thức trên).

Để đo lường mức độ tập trung (hoặc vấn đề “dystopia B”), chỉ số Herfindahl-Hirschman là một điểm bắt đầu tuyệt vời và đã được sử dụng để đo lường mức độ tập trung kinh tế trong các ngành:

\(\frac{\sum_{i=1}^n x_i^2}{(\sum_{i=1}^n x_i)^2}\)

Hoặc cho bạn những người học trực quan ngoài kia:


Chỉ số Herfindahl-Hirschman: diện tích cây xanh chia cho tổng diện tích.

Có những lựa chọn thay thế khác cho điều này; chỉ số Theil T có một số thuộc tính tương tự mặc dù cũng có một số khác biệt. Một giải pháp thay thế đơn giản và ngớ ngẩn hơn là hệ số Nakamoto: số lượng người tham gia tối thiểu cần thiết để chiếm hơn 50% tổng số. Lưu ý rằng cả ba chỉ số tập trung này đều tập trung chủ yếu vào những gì xảy ra ở gần đỉnh (và cố ý như vậy): một số lượng lớn những người tham gia với một lượng nhỏ tài nguyên đóng góp rất ít hoặc không đóng góp gì cho chỉ số, trong khi hành động sáp nhập của hai người tham gia hàng đầu có thể thực hiện một thay đổi rất lớn đối với chỉ mục.

Đối với các cộng đồng tiền điện tử, nơi tập trung tài nguyên là một trong những rủi ro lớn nhất đối với hệ thống nhưng khi ai đó chỉ có 0,00013 xu thì không phải là bất kỳ loại bằng chứng nào cho thấy họ đang thực sự chết đói, thì việc áp dụng các chỉ số như thế này là cách tiếp cận rõ ràng. Nhưng ngay cả đối với các quốc gia, việc tập trung quyền lực và gánh chịu thiếu nguồn lực có lẽ cũng đáng để nói và đo lường một cách riêng biệt hơn.

Mà nói, đến một lúc nào đó chúng ta phải vượt ra ngoài cả những chỉ số này. Tác hại của sự tập trung không chỉ là một chức năng của quy mô của các tác nhân; chúng cũng phụ thuộc nhiều vào mối quan hệ giữa các tác nhân và khả năng thông đồng với nhau của họ. Tương tự như vậy, việc phân bổ nguồn lực phụ thuộc vào mạng lưới: việc thiếu các nguồn lực chính thức có thể không gây hại nếu người thiếu nguồn lực có một mạng lưới không chính thức để khai thác. Nhưng giải quyết những vấn đề này là một thách thức khó khăn hơn nhiều, vì vậy chúng tôi cũng cần các công cụ đơn giản hơn trong khi chúng tôi vẫn có ít dữ liệu hơn để xử lý.

Thanh Thuy

Leave a Reply

Your email address will not be published. Required fields are marked *