Експерти: Ілон Маск неправильно підраховує підрахунок фейків і спаму в Twitter

Експерти: Ілон Маск неправильно підраховує підрахунок фейків і спаму в Twitter

Генеральний директор Tesla Ілон Маск вважає, що акції Twitter падають у п’ятницю, коли він заявив, що збирається призупинити придбання соціальної мережі за 44 мільярди доларів, поки він досліджує частку фейкових і спам-акаунтів на платформі.

Хоча пізніше Маск пояснив, що залишається відданим угоді, він продовжував забивати питання про фейкові акаунти. Він написав у Twitter, що його команда зробить власний аналіз, і висловив сумнів щодо точності чисел, які Twitter повідомив у своїх останніх фінансових звітах.

У своєму звіті про прибутки за перший квартал цього року Twitter визнав, що на його платформі є ряд «помилкових облікових записів або облікових записів зі спамом», а також легітимних щоденних активних користувачів (mDAU), які можна монетизувати. Компанія повідомила: «Ми провели внутрішню перевірку вибірки облікових записів і підрахували, що середня кількість помилкових або спам-рахунків у першому кварталі 2022 року становила менше 5% нашого mDAU протягом кварталу».

Twitter також визнав, що за останні 3 роки кількість користувачів перевищила на 1,4-1,9 мільйона користувачів. Компанія написала: «У березні 2019 року ми запустили функцію, яка дозволяла людям пов’язувати кілька окремих облікових записів разом, щоб зручно перемикатися між обліковими записами», – повідомляє Twitter. “У той час була допущена помилка, так що дії, здійснені через основний обліковий запис, призвели до того, що всі пов’язані облікові записи враховувалися як mDAU”.

Хоча Маск може бути виправдано допитливим, експерти з соціальних медіа, дезінформації та статистичного аналізу кажуть, що запропонований ним підхід до подальшого аналізу вкрай неповноцінний.

Ось що сказав генеральний директор SpaceX і Tesla, що він зробить, щоб визначити, скільки спаму, підроблених і повторюваних облікових записів існує в Twitter:

«Щоб це дізнатися, моя команда зробить випадкову вибірку із 100 підписників @twitter. Я запрошую інших повторити той самий процес і подивитися, що вони знайдуть». У наступних твітах він пояснив свою методологію, додавши: «Виберіть будь-який обліковий запис з великою кількістю підписників» і «Ігноруйте спочатку 1000 підписників, а потім вибирайте кожного 10-го. Я відкритий для кращих ідей».

Маск також сказав, не надавши доказів, що він вибрав 100 як число вибірки для свого дослідження, тому що це число, яке Twitter використовує для обчислення цифр у своїх звітах про прибутки.

«Будь-який чутливий процес випадкової вибірки – це добре. Якщо багато людей незалежно отримують подібні результати для % фальшивих/спамових/дублікатів облікових записів, це буде показово. Я вибрав 100 як число вибірки, тому що це те, що Twitter використовує для обчислення <5 %fake/spam/duplicate."

Twitter відмовився коментувати, коли його запитали, чи точний його опис його методології.

Співзасновник Facebook Дастін Московіц зважив на це питання через свій власний акаунт у Twitter, зазначивши, що підхід Маска насправді не є випадковим, використовує занадто малу вибірку і залишає місце для масових помилок.

Він написав: «Також я відчуваю, що «не довіряє команді Twitter допомогти отримати вибірку» — це своєрідний червоний прапор».

Засновник і генеральний директор BotSentinel Крістофер Бузі сказав в інтерв’ю CNBC, що аналіз його компанії показує, що від 10% до 15% облікових записів у Twitter, ймовірно, є «неавтентичними», включаючи підробки, спамерів, шахраїв, злих ботів, дублікатів та «один- цільові акаунти ненависті», які, як правило, націлені на людей і переслідують їх, а також інших, які навмисно поширюють дезінформацію.

BotSentinel, який в основному підтримується за допомогою краудфандингу, самостійно аналізує та визначає неправдиву активність у Twitter, використовуючи поєднання програмного забезпечення машинного навчання та команди рецензентів. Сьогодні компанія відстежує понад 2,5 мільйона акаунтів у Twitter, переважно англомовних користувачів.

«Я думаю, що Twitter не реалістично класифікує «помилкові та спамові» акаунти», – сказав Бузі.

Він також попереджає, що кількість неавтентичних облікових записів може бути більшою або меншою в різних куточках Twitter залежно від тем, що обговорюються. Наприклад, BotSentinel виявив, що більше неправдивих облікових записів твітує про політику, криптовалюти, зміну клімату та covid, ніж ті, що обговорюють такі несуперечливі теми, як кошенята та орігамі.

«Я просто не можу уявити, що Маск займається чимось іншим, окрім як троллює нас за допомогою цієї дурної схеми вибірки».

Карл Т. Бергстром

Автор, “Виклик биків—“

Карл Т. Бергстром, професор Вашингтонського університету, який був співавтором книги, щоб допомогти людям зрозуміти дані та уникнути помилкових заяв в Інтернеті, сказав CNBC, що вибірка сотень підписників будь-якого окремого облікового запису Twitter не повинна служити «належною обачністю». “за придбання на суму 44 мільярди доларів.

Він сказав, що вибірка з 100 на порядки менша за норму для дослідників соціальних мереж, які вивчають подібні речі. Найбільша проблема, з якою Маск зіткнувся з таким підходом, відома як упередженість відбору.

Бергстром написав у повідомленні CNBC: “Немає підстав вважати, що підписники офіційного облікового запису Twitter є репрезентативною вибіркою облікових записів на платформі. Можливо, боти рідше стежать за цим обліковим записом, щоб уникнути виявлення. Можливо, вони більш імовірно Хто знає? Але я просто не можу зрозуміти, що Маск робить щось інше, крім як троллює нас за допомогою цієї дурної схеми вибірки”.

.

Залишити коментар

Ваша e-mail адреса не оприлюднюватиметься.