ایمیزون کے کارکن آپ کو الیکسا – بلومبربر کو بتائیں کہ کیا سنتے ہیں

ایمیزون کے کارکن آپ کو الیکسا – بلومبربر کو بتائیں کہ کیا سنتے ہیں

(بلومبرگ) – لاکھوں لوگوں کے اسمارٹ اسپیکرز اور ان کے صوتی سافٹ ویئر کو کھیل کھیلنے کے لئے استعمال کرتے ہیں، ترویجیا کے لئے موسیقی تلاش کریں یا ٹرال. لاکھوں مزید ان آلات اور ان کے طاقتور مائکروفون کو اپنے گھروں میں تشویش دینے سے انکار کرنے کے لئے ناگزیر ہیں کہ کسی کو سنبھالنا ہو گا.

Amazon.com Inc. دنیا بھر میں ہزاروں افراد کو ایکوکی اسپیکرز کی اس لائن کو اقتدار دینے والے الیکسا ڈیجیٹل اسسٹنٹ کو بہتر بنانے میں مدد فراہم کرتی ہے. ٹیم اقوام کے مالکان کے گھروں اور دفاتر میں ریکارڈ کردہ ریکارڈنگ کی آواز سنتی ہے. ریکارڈنگ ٹرانسمیشن کیا جاتا ہے، تشریح شدہ اور پھر اس کے بعد سافٹ ویئر میں آکسیبا کی انسانی تقریر کی تشہیر میں فرق کو ختم کرنے کی کوشش کے ایک حصے کے طور پر کھلایا اور اسے بہتر طور پر حکموں کا جواب دینے میں مدد ملے گی.

الیکسوا صوتی جائزہ لینے کا عمل، جس میں سات افراد نے اس پروگرام پر کام کیا ہے، کی طرف سے بیان کیا ہے، تربیتی سافٹ ویئر الگورتھم میں اکثر نظر انداز انسانی کردار کو نمایاں کرتا ہے. مارکیٹنگ کے سامان میں ایمیزون کا کہنا ہے کہ ایلیکس “بادل میں رہتا ہے اور ہمیشہ ہوشیار ہو رہا ہے.” لیکن تجربے سے سیکھنے کے لئے تیار کردہ بہت سے سافٹ ویئر کے اوزار کی طرح، انسانیں کچھ تدریس کر رہی ہیں.

اس ٹیم میں جو لوگ بوسٹن سے کوسٹا ریکا، بھارت اور رومانیہ سے باہر ہونے والے مقامات پر کام کرنے والے ٹھیکیداروں اور مکمل وقت ایمیزون ملازمتوں میں شامل ہوتے ہیں، ان کے مطابق، پروگرام کے بارے میں عام طور پر بولنے سے غیر ملکی افادیت کے معاہدے پر دستخط کئے گئے لوگوں کے مطابق. رومانیا کے دارالحکومت کے آنے والے اور آنے والے آنے والے گلوبلورت کی عمارت کے سب سے اوپر تین فرش پر مشتمل ہیں، جو دو روزہ نوکھ گھنٹے کام کرتے ہیں، ہر ایک جائزہ لینے والے کے مطابق ہر ایک سے زیادہ 1،000 آڈیو کلپس کی تبدیلی ہوتی ہے. پیپرا ضلع. جدید سہولت خالی عمارتوں کے درمیان باہر کھڑا ہے اور ایمیزون کی موجودگی میں کوئی بیرونی نشان زد نہیں ہوتا ہے.

یہ کام زیادہ تر بھنڈر ہے. بوسٹن میں ایک کارکن نے کہا کہ اس نے “ٹیلر سوئفٹ” جیسے مخصوص الفاظ کے لئے آواز کی آواز جمع کی ہے اور ان کی نشاندہی کرنے کے لئے تلاش کرنے والا موسیقار کا مطلب ہے. کبھی کبھی سامعین چیزوں کو اٹھاو گونج مالکان غالبا نجی رہیں گے: ایک عورت شاور، کہہ، یا مدد کے لئے چلنے والی بچہ میں کلیدی طور پر کلید گانا. ٹیموں کو فائلوں کو اشتراک کرنے کے لئے اندرونی چیٹ روم کا استعمال کرتے وقت جب وہ گونگا لفظ کو پار کرنے میں مدد کی ضرورت ہے یا آمیز ریکارڈنگ بھر میں آتے ہیں.

ایمیزون کے کارکن آپ کو الیکسہ کو بتاتے ہیں سنتے ہیں

کبھی کبھی وہ ریکارڈنگ سنتے ہیں جو انھیں اپیل کرنے یا ممکنہ طور پر مجرمانہ طور پر تلاش کرتے ہیں. دو کارکنوں نے کہا کہ انہوں نے جنسی حملہ کی یقین دہانی کرلی ہے. جب ایسا ہوتا ہے تو وہ اندرونی چیٹ روم میں کشیدگی کو دور کرنے کے راستے کے طور پر تجربے کا اشتراک کرسکتے ہیں. ایمیزون کا کہنا ہے کہ کارکنوں کے لئے اس کے طریقہ کار پر عملدرآمد ہے جب وہ کسی پریشان کن سنتے ہیں، لیکن رومانیہ کے مابین ملازمین نے کہا کہ، ایسے معاملات کے لئے رہنمائی کی درخواست کے بعد انہیں بتایا جاتا تھا کہ یہ مداخلت کرنے کے لئے ایمیزون کا کام نہیں تھا.

ایمیزون کے ترجمان نے ایک ای میل شدہ بیان میں بتایا کہ “ہم اپنے گاہکوں کی ذاتی معلومات کو سنجیدگی سے لے کر سنجیدہ ہیں.” “ہم صرف کسٹمر کے تجربے کو بہتر بنانے کے لئے یکساں آواز کی ریکارڈنگ کا ایک بہت چھوٹا نمونہ بیان کرتے ہیں. مثال کے طور پر، یہ معلومات ہماری تقریر کی شناخت اور قدرتی زبان کی سماعت کے نظام کو تربیت دینے میں مدد کرتی ہے، لہذا الیکسا آپ کی درخواستوں کو بہتر سمجھا سکتے ہیں، اور یہ یقینی بنائیں کہ سروس ہر کسی کے لئے اچھی طرح سے کام کرتا ہے.

“ہمارے پاس سخت تکنیکی اور آپریشنل حفاظتی انتظامات ہیں اور ہمارے نظام کے استعمال کے لئے صفر رواداری کی پالیسی ہے. ملازمت ایسے معلومات تک براہ راست رسائی نہیں رکھتے جو اس کام کے بہاؤ کے حصے کے طور پر شخص یا اکاؤنٹ کی شناخت کرسکتے ہیں. تمام معلومات اعلی رازداری سے منسلک کیا جاتا ہے اور ہم اس کے تحفظ کے لئے اپنے کنٹرول کے ماحول کے حصول، سروس خفیہ کاری اور آڈٹ کو محدود کرنے کے لئے کثیر عنصر کی تصدیق کرتے ہیں. ”

ایمیزون، اپنی مارکیٹنگ اور رازداری کی پالیسی کے مواد میں، واضح طور پر نہیں کہتے کہ انسان Alexa کی طرف سے اٹھایا کچھ بات چیت کی ریکارڈنگ سننے کے لئے کر رہے ہیں. کمپنی اکثر پوچھے گئے پوچھے گئے سوالات کی فہرست میں کہتے ہیں، “ہماری تقریر کی شناخت اور قدرتی زبان کو سمجھنے کے نظام کو تربیت دینے کے لئے ہم آپ کی درخواستوں کو Alexa پر استعمال کرتے ہیں.”

Alexa کی رازداری کی ترتیبات میں، کمپنی صارفین کو نئی خصوصیات کی ترقی کے لئے اپنے صوتی ریکارڈنگ کے استعمال کو غیر فعال کرنے کا اختیار دیتا ہے. بلومبرگ کی طرف سے جائزہ لیا گیا اسکرین شاٹ سے پتہ چلتا ہے کہ الیکسوا آڈیٹرز کو بھیجنے والے ریکارڈنگ کو صارف کے مکمل نام اور پتہ فراہم نہیں ہوتا لیکن اکاؤنٹ اکاؤنٹنگ کے ساتھ ساتھ صارف کا پہلا نام اور آلہ کا سیریل نمبر ہے.

انٹرویو نے اس سال پہلے رپورٹ کیا کہ ایمیزون ملکیت کے ملازمین نے دستی طور پر کمپنی کے گھنٹی کیمرے کی طرف سے قبضہ کیے جانے والی ویڈیو میں گاڑیاں اور لوگوں کی شناخت کی ہے، اس کو خود کو سافٹ ویئر کو بہتر بنانے کی کوشش کرنا.

ماہی گنی یونیورسٹی کے ایک پروفیسر فلوریان شوب نے کہا کہ آپ اسمارٹ اسپیکر سے متعلق رازداری کے معاملات کی تحقیقات کرتے ہیں. “مجھے لگتا ہے کہ ہم [فرض] کے لئے شرط دی گئی ہے کہ یہ مشینیں صرف جادو مشین سیکھنے کر رہی ہیں. لیکن حقیقت یہ ہے کہ اب بھی دستی پروسیسنگ شامل ہے. ”

“کیا یہ رازداری کی تشویش ہے یا اس پر منحصر نہیں ہے کہ کس طرح محتاج ایمیزون اور دیگر کمپنیاں ان میں سے کس قسم کی معلومات میں دستی طور پر تشویش کی جاتی ہیں، اور وہ کس طرح معلومات کو کسی کو پیش کرتے ہیں.”

جب 2014 میں منعقد ہوا تو، ایمیزون کی سلنڈر سمارٹ اسپیکر نے گھر میں صوتی سافٹ ویئر کے استعمال کو تیزی سے مقبول کیا. طویل عرصے سے پہلے، حروف تہجی انکارپوریٹڈ نے اس کے اپنے ورژن کو شروع کیا، جسے Google ہوم کہا جاتا ہے، اس کے بعد ایپل انکارپوریٹڈ کے ہوم پوڈ. چین میں مختلف کمپنیاں اپنے آلات بھی بیچتے ہیں. گلوبل کے مطابق، محققین کینالیس کے مطابق گزشتہ سال 78 ملین ہوشیار اسپیکرز خرید چکے ہیں. لاکھوں زیادہ صوتی سافٹ ویئر ان کے اسمارٹ فونز پر ڈیجیٹل اسسٹنٹ کے ساتھ بات چیت کرنے کے لئے استعمال کرتے ہیں.

Alexa سافٹ ویئر آڈیو کے سنیچ مسلسل ریکارڈ کرنے کے لئے ڈیزائن کیا گیا ہے، ایک جاگ لفظ سننے کے لئے. یہ “الیکسا” ڈیفالٹ کے ذریعہ ہے، لیکن لوگ اسے “اچو” یا “کمپیوٹر” میں تبدیل کرسکتے ہیں. جب جیو لفظ کا پتہ چلا جاتا ہے تو، اونو کے اوپر کی روشنی کی انگوٹی بدل جاتا ہے، یہ اشارہ کرتا ہے کہ آلہ ایک ریکارڈنگ اور ریکارڈ کرنے والا بوم ہے. ایمیزون سرورز

ایمیزون کے کارکن آپ کو الیکسہ کو بتاتے ہیں سنتے ہیں

زیادہ سے زیادہ جدید تقریر کی شناخت کے نظام انسانی دماغ پر نمونہ نیورل نیٹ ورک پر انحصار کرتی ہیں. یہ سافٹ ویئر سیکھتا ہے جیسا کہ یہ جاتا ہے، اعداد و شمار کو وسیع پیمانے پر ڈیٹا کے ذریعے. اچو اور دیگر سمارٹ اسپیکرز کو طاقتور الگورتھمز تعلیم کے اندازے کے مطابق امکانات کے ماڈل استعمال کرتے ہیں. اگر کسی کے پاس کوئی یونانی جگہ ہے تو کسی کو الیکسہ سے پوچھتا ہے، الورگتھیم جانتا ہے کہ صارف شاید ایک ریستوران کی تلاش میں ہے، چرچ یا کمیونٹی مرکز نہیں.

لیکن کبھی کبھی الیکسا یہ غلط ہو جاتا ہے – خاص طور پر جب انگریزی کے علاوہ نئے سلانگ، علاقائی کالونیائیزیزیز یا زبانوں کے ساتھ انگوٹھا ہوتا ہے. فرانسیسی میں، Ave سی، “اس کے ساتھ” یا “اس کے ساتھ،” سافٹ ویئر کو کسی کو سوچنے میں الجھن کر سکتے ہیں کسی کو Alexa جاگ لفظ کا استعمال کر رہا ہے. اسکو، حقیقت یا معنوں کے لئے ہسپانوی، کبھی کبھی اونو کے طور پر غلط تشریح کی جاتی ہے. اور اسی طرح. اسی وجہ سے ایمیزون نے انسانی مددگاروں کو الگ الگ الگ الگ کی طرف سے یاد کیا فرقوں کو بھرنے کے لئے بھرتی کیا.

ایپل کی سیری میں انسانی مددگار بھی شامل ہیں، جو اس بات کا اندازہ لگاتے ہیں کہ آیا ڈیجیٹل اسسٹنٹ کی تشریحات کی تشریحات اس شخص کے ساتھ ہوتی ہیں جو شخص نے کہا ہے. ایک ایپل سیکورٹی سفید کاغذ کے مطابق، ریکارڈنگ ان کی نظر ثانی شدہ ذاتی طور پر شناختی معلومات نہیں ہیں اور بے ترتیب شناخت کنندہ کے ساتھ چھ ماہ کے لئے محفوظ کیا جاتا ہے. اس کے بعد، اعداد و شمار اس کی بے ترتیب شناخت کی معلومات سے چھٹکارا ہے لیکن سیری کی آواز کی شناخت کو بہتر بنانے کے لئے طویل عرصے تک ذخیرہ کیا جا سکتا ہے.

کمپنی کا کہنا ہے کہ گوگل پر، کچھ مبصرین اس کے اسسٹنٹ سے کچھ آڈیو چھٹیاں تک رسائی حاصل کرنے اور مصنوعات کو بہتر بنانے میں مدد کرسکتے ہیں، لیکن یہ کسی بھی ذاتی طور پر شناختی معلومات کے ساتھ منسلک نہیں ہے اور آڈیو خراب ہو گئی ہے.

بخارسٹ کے الیکسا ڈیٹا سروسز کے لئے ایک کوالٹی اشورینس مینیجر کی تلاش میں ایک حالیہ ایمیزون کام کی اشاعت، کردار انسان انسان کی وضاحت کرتا ہے: “ہر دن وہ [الیکسوا] مختلف موضوعات اور مختلف زبانوں کے بارے میں اس سے گفتگو کرنے والے ہزاروں افراد کو سنتا ہے، اور وہ ہماری ضرورت ہے. یہ سب کچھ سمجھنے میں مدد ملتی ہے. “چاہتے ہیں کہ اشتھار جاری رہیں.” ​​یہ بڑی ڈیٹا ہینڈلنگ ہے جیسے آپ نے اسے کبھی نہیں دیکھا ہے. ہم روزانہ کی بنیاد پر وسیع پیمانے پر تقریر کا استعمال کرتے ہوئے، لیبلنگ، گھومنے اور تجزیہ کر رہے ہیں. ”

تقریر کے اعداد و شمار کے لئے ایمیزون کی جائزہ لینے کا عمل شروع ہوتا ہے جب Alexa بے ترتیب، چھوٹی سی نمونہ گاہک کی آواز کی ریکارڈنگ کو ھیںچتا ہے اور پروگرام کے ڈیزائن سے واقف شخص کے مطابق، دور دراز ملازمین اور ٹھیکیداروں کو آڈیو فائلوں کو بھیجتا ہے.

ایمیزون کے کارکن آپ کو الیکسہ کو بتاتے ہیں سنتے ہیں

کچھ الیکسیا کے مبصرین کو صارفین کے حکموں کے ساتھ کام کیا جاتا ہے، جو کہ الیکسہ کے خود کار طریقے سے ٹرانسپٹ سے متعلق ریکارڈنگ کے مطابق، صارف اور مشین کے درمیان بات چیت کا اعلان کرتے ہیں. شخص نے کیا پوچھا؟ کیا الیکسا نے مؤثر ردعمل فراہم کیا؟

دوسروں کو ہر چیز کو یاد ہے کہ اسپیکر چنتا ہے، پس منظر کی بات چیت بھی شامل ہے- یہاں تک کہ جب بچے بول رہے ہیں. بعض اوقات سننے والے صارفین کو ذاتی تفصیلات جیسے نام یا بینک کی تفصیلات پر گفتگو کرتے ہوئے سنتے ہیں؛ ایسے معاملات میں، وہ “نازک اعداد و شمار” کی نشاندہی کرنے والے ڈائیلاگ باکس کو ٹینک کرنا چاہتے ہیں. پھر وہ اگلے آڈیو فائل پر جائیں گے.

ایمیزون کی ویب سائٹ کے مطابق، آڈیو کو ذخیرہ نہیں کیا جاتا ہے جب تک کہ اونو لفظ کا پتہ لگاتا ہے یا بٹن پر دباؤ کرکے چالو ہوجاتا ہے. لیکن کبھی کبھی الیکسا کسی بھی فوری طور پر بغیر ریکارڈنگ شروع کرنا شروع ہوتا ہے، اور آڈیو فائلوں کو ایک تلخانہ ٹیلی ویژن یا ناقابل یقین شور سے شروع ہوتا ہے. سرگرمی چاہے یا غلط نہیں ہے، تجزیہ کار اس کو ٹرانسمیشن کرنے کی ضرورت ہے. لوگوں میں سے ایک نے بتایا کہ جب اکیلا کوئی جھوٹ کمانڈ حاصل نہیں کرتا تو حادثے کے نتیجے میں آڈیٹر ہر ایک کو 100 ریکارڈنگ لکھتے ہیں.

دنیا بھر میں گھروں میں، دو مشتبہ افراد کے مطابق، مالک کے مالک مالک اکثر اس کے بارے میں وضاحت کرتے ہیں کہ کون سنا جا سکتا ہے. “کیا آپ این ایس اے کے لئے کام کرتے ہیں؟” وہ پوچھتے ہیں. “الیکسا، کیا کسی اور کو ہماری بات سنتی ہے؟”