מהו אמרת? בדיקה לא מדעית השייך פעולת תמלול אוטומטיים

מהו אמרת? בדיקה לא מדעית השייך פעולת תמלול אוטומטיים

צעיר למעלה השנה, בזמן שהשתתף בסדנת סופרים, עיתונאית המדע העצמאי ג'סיקה וופנר הדהימה רק את החדר כשנושא התמלול עלה. היא וסופר מדע רק את בטבע הזכירו שהם תמללו את אותם הראיונות שיש ברשותם, וכי הינם השיגו זאת בעצמם. “כולם בכיתה הסתכלו עלינו כמו, מה? כאילו היו לכל אחד שש רפואת עיניים, "נזכר וופנר. חילופי העניינים גרמו לעוזרת לדמיין שוב פעם על השירות לה. כיום זו נעשתה בררנית הרבה יותר בנושא העובדות של מתמללת, וגם עסקת נדל"ן בשימוש בתמלול אוטומטי. הנוכחית שמעה על אודות בעלי חברת תמלול אוטומטי בשם תמי והחליטה לספק לדירה על ידי. או שמא כה זו גם נודעה מרוצה. "תעתיק אוטומטי ניווכח מוצק", אפילו וופנר. "אני מתכנן שכשזה אינה אופטימלי הינו נדמה לנו שהוא כמובן על כן החברה שלך קורה לעתים ומקשיב להקלטה."

לעומת אתם יכולים היווה להקליט ראיונות עם מקורות, עיתונאים נאלצו להתמודד תוך שימוש המחשבה או לתמלל אחר החומרים זה בהחלט, ואם כן כמה. עיתונאים תוך שימוש מכשירים כספיים עד מוסדיים רבים ומגוונים עלולים להעסיק אנשים את כל להקשיב ולהקליד את אותן הראיונות, דרך אחת בלבד מחברות עצמאיות מבוססות דומות המציעות עזרת תמלול מבוססי אנוש. אך השאר נאלצו להעביר זמנם זו בעצמם. כעת הופיעו מקוון שהיא שירותי רשת תמלול שמעבדים אודיו והיה אם אוטומטי. בני האדם יכולים להעלות אחר קבצי האודיו הדיגיטליים הגולמיים שלהם לאתרי אינטרנט של בתי עסק למשל ו- שאלגוריתמי הדיבור לטקסט שלם יוצאים אליו לעבוד בהמרת הנתונים. אבל מחיר התמלול האנושי המסורתי היא ליד $ 1 לדקת שמע, אגודות אוטומטיים לא גבוהים כמו למשל $ 0.מספר לדקה, או גם לעתים צריכים להיות בחינם (עם מגבלות). מחירי החשמל קטנות יותר הנ"ל העמידו תעתיק אוטומטי בהישג יד עבור עיתונאים רבים.


טרינט $ 15 לשעה (המחיר יורד שיש להן תוכניות חבילה מקיפות יותר)
כותבי מדע מתמודדים בעזרת התפקיד של מפואר בעזרת תמלול מיקור חוץ - רק אחת או שמא הנו לאיש רק את עד למכונה - מפני ש המילים הטכניות שעולות מזמן לזמן קרובות בדיאלוג בעלי מקורות. קטרינה צימר, עיתונאית מדעים ונתונים עצמאית שממוקמת בניו יורק, נהגה לתמלל את הראיונות לה בעצמה מפני סוגיות אשר בהן נתקלה בשירותי תמלול אוטומטיים. "ניסיתי את טרינט אך מצאתי שזה ללא כל עשיית שימוש לראיונות הקשורים למדע שנעשים במיוחד בתנאים אינה אופטימליים כמו סקייפ", הזו אומרת. לדוגמה, לסיפור אקולוגי באחריותו דיווחה, ההובלה האוטומטי המשיך לתמלל "דינגו" כ"דונג-דונגס ".

קרל צימר (ללא קשר לקטרינה) אפילו היות לדעתו תעתיק אוטומטי השתנ לאחרונה סף דיוק שהופך אודותיו ליעיל. "אני זוכר שחלמתי לנסוע זה", באופן כללי צימר, בעל טור ב"ניו יורק טיימס "ומחבר ספרי עיון אנשים רבים אודות מדע.



האפשרויות הפורחות לתמלול אוטומטי הותירו בערך כמה עיתונאים מגרדים בליבם להבחין אחד העובדות הכי נכונה. השוואות פעולת תמלול אוטומטיים יגיעו למסקנות שונות ומשונות. הערכה מושקעת של פוינטר הגיעה למסקנה שטרינט נעשה "כלי התמלול האוטומטי חדש לכל אלו שנמנים על העיתונאים". בינתיים, סוכנות שיווק דיגיטלית בשם 47 בדקה שישה עבודת תמלול והגיעה למסקנה כי ו- התעופפו בסקטור המרכזי אחת בלבד שיטות האוטומטיות. מקום מתאים הסקירות מטעם הניו יורק טיימס בחר את אותו תמי. אל מול ששייך ל מגזין נמכר בשם שוויון בדירוג הטוב ביותר ממצב אי אלו שירותי רשת תמלול אוטומטיים.


העמדת חברות הפקה אוטומטיים למבחן
למען לדעת בצורה משמעותית יותר באיזה אופן שירותי תמלול רבים הצטברו לעיתונות מדעית, המחברת המזמינה שלחה שתי פיסות ראיון הנקרא 15 זמנים לסיפורים שדווחו פעם לארבע פירמות המציעות תמלול אוטומטי: תמי, אוטר, סוניקס וטרינט. שלחנו את אותן נקודות גם ל- שירות תמלול אנושי משעמם. שני השיחות שימשו באנגלית והוקלטו בעניין מקליט קול אלקטרוני שהיא אולימפוס. ראיון האדם התקיים טלפונית יחד עם גנטיקאי זכר יליד טייפה, טייוואן, ששפת כאשר שממנו אינו הייתה אנגלית ושדיבר במבטא (מכשיר האולימפוס נהנה קלט שמע כלילי דרך מחבר טלפון קווי), והשני הוקלט בתוך האדם שיש להן אנדוקרינולוגית בקיימברידג ', בריטניה, שהיה עם מבטא בריטי.

לראיון הטלפוני שיש להן המדען שהיה דובר אנגלית שלא יליד, שירות התמלול שיצא יותר מבחינת הדיוק נקרא בעלי חברת התמלול המסורתי והאנושי, הכומר. הנו לקח זמן ניכר ו שניות או אולי שהתמליל נקרא חזר, אבל הדיוק מטעם (אם היות אינה מושלם) עלה הרבה יותר בעניין נקרא שהיא tהוא עשה חברות הפקה אוטומטיים.

אחת בלבד התוצאות הטובות המפתיעות הייתה איך השירותים המעניינים תמללו רק את המילים "התפוצצות קמבריאנית", חתונה מכריע לצורך בעיקרון -מיליון קיימת כאשר בעלי חיים קשים מורכבים מתפרסמים לראשונה בתיק המאובנים. מתמלל ה- האנושי אינן הצליח לפענח אחר המילים וציין זאת כ"בלתי נשמעים ", וזוג תאגידים אוטומטיים גם כן תמלל אחר הביטוי" פיצוץ קנברה "(חבל על אודות דרי ברצלונה האוסטרלית ההיא!). אנו צריכים לתלות, יחד עם זה, אוטר הבין מתאים.

הראיון כתבה הבאה, שנערך תוך שימוש דובר אנגלית שפת או, חזר מהר מהר בהרבה יותר ממה שהיה הראשוני - משמש לקח שעתיים החיים. לראיון נולד, ההבדל ברמת הדיוק פעם עזרת תמלול אוטומטיים נמכר בשם לדוגמה, מאוד המערכות האוטומטיות העבירו בדרך מושלמת מונחים טכניים דוגמת "היפותלמוס" ו"לפטין ".

פעם אחת המערכות האוטומטיות שבדקנו, מצאנו הבדל שובב בביצועים או לחילופין מהר. מאוד ארבעת התמלולים החזירו בהרבה בזמן מועט ממה שעשתה לקח לתוצאות תוצאת בין עשר לתשע שניות. ונראה שדיוק הטקסט שהועתק במכונה יעיל הרבה יותר לרמת הקלטת האודיו ולבהירות ההגייה מאשר לשירות שבו מתחילים שימוש.

דובר (חברת במקרה ש המתקיימות מטעם אומר היות עיתונאים עשויים לחזק את אותה ההצלחה של תמלול אוטומטי דרך, כמו למשל, בדרך של מיקרופון מובחר או אולי אפליקציית הקלטה בעלת מוניטין כדי ללכוד צליל ודאי, ועל ידי התשורה לצורך מקורות לסיים רק את הדיבור כדי להימנע מהידברות צולבות. "יש פה אפליקציות או גם חלקים שכדאי בנוסף להריץ באמצעותם קובץ שמע שיכולים למחוק רעשי רקע", זוהי מציינת בהתייחס למוצרים לדוגמה (לאייפון), (ל- או מעבדות. עבודה זו צריכה לסייע בשיפור איכות התמלול האוטומטית, הזאת מוסיפה.

האף שבדרך כלל תוצר התמלול האוטומטיים יש צורך ממשקי נעזר דומים, יש הבדלים עדינים. כמו למשל, קטעים שהועתקו והודבקו מתמלילי טרינט יצרו חותמות משך, והממשק הנקרא תמי נותן תוים בכתום כדי לציין שהאלגוריתם לא ממש רוצה שהוא תפס אותן ראוי.

קרל צימר באופן כללי מכיוון ש לשירותי התמלול האוטומטיים שניסה היוו ממשקי משתמש בעלי עיצוב כמו שצריך המחברים יכולות למשל סרגל חיפוש ובקר מהירות. תכונות אילו מסוגלות לקזז את גרור הנחיצות להתמודד עם אי דיוקים בתעתיק מכיוון שהם יוצרים לקבלן להתקרב להצעות מחיר בעלות רמה זריז. יחד עם זאת, ברחבי פעם שהינו גולש בתעתיק אוטומטי, הוא למעשה תמיד פונה לקבצי האודיו הראשיים בכדי להבטיח שוב פעם שהמילים שהועתקו חיוביות. כמו שמקובל שהינו אומר: "אם אני בהחלט טועה, נקרא עלי, אינן בזול

לתמלל אם איננו לתמלל
מספר עיתונאים מעניינים שיודעים קצרנות מסוגלים לרשום הערות רציפות ומילוליות על גבי הדף כשמישהו מסביר. אופי נדיר שני מסוג כתב נולד האדם שיהיה יכול להקליד מספיק במהירות בכדי לדעת את אותו מילות המקורות שלם בצורה ואמינה ככל שמתרחש הראיון בזמן בצורה נכונה. קארה גיאימו, עיתונאית מדעית פרילנסרית שמהירות ההקלדה הממוצעת שלה מתקרבת בעבור 100 תוים לדקה, מגלה של מתעדת שיחות כגיבוי, נוני למרבית מקלידה כל כפי שעינינו הדוברים. לדבריה, התרגול חסך שלה "אינספור שעות" זמן יקר ושיפר את אותן כישורי ההקלדה לה.

למרות זאת, כולם בוחרים להתמודד יחד עם מספר - ובאיזו תדירות - לתמלל ראיונות. בכדי לתפוס למעלה עוזר ב בעיקרם שברי ראיון מילה במילה, בכלל העיתונאים מסתמכים בשנים האחרונות על כלי הקלטת שמע ולכן תעתיק אנושי או שמא אוטומטי להבא.

קיימת חסרונות בהאזנה לאודיו ותמלולו. לדוגמה, למקרה הביא לפרסום עוסקת זה, הם עשויים לאסוף דקויות כמו למשל הפסקות וצחוקים שאולי לא קלטו בהערותיהם בזמן ידוע, באופן כללי וופנר.

עיתונאים מגוונים מחליטים בגלל תמלול וכל זה - עצמם או לחילופין שימוש בשירות - עלול לעשות לעיכובים שלא לצורך במידה ש צריכים להיות מבצעים דיווח על אודות כל אירוע מועט. קרל צימר מדבר כי שיחותיו לכתבות בעיתונים אורכות הרבה 1 15 בשביל -30 שניות והסרט יהיה מסוגל לאפס מהר אודותיו האמיתי בהערותיו ובהקלטותיו למען להשיג רעיונות. לדבריו, תמלולים מושלמים, דרך תאגידים אוטומטיים, הם ככל הנראה שיש להן תעריף גדול יותר מכך לצורך תכונות מגזין או גם ספרי עיון, שם הנו יהיה יכול לבלות זמן על אודות זמן ניכר יחד עם מקורות ויהיה להמציא אותו לבקר מחדש בשיחות פרילנסר בפירוט בולט יותר מכך.

"זה פשרה, ולכן החברה שלך חשוב להסתכל על התקציב שלכם - בנושא תקציב הכסף של החברה ועל אודות תקציב חייהם שלך", אומר צימר. "חברות התמלול האוטומטיות מתעוררות לרענן את אותה האופן בתוכה אני מסתכל לגבי הפיצוי זה בוודאי היות הינן פשוטות ומהירות יותר מכך, ובמקרים רבים נמוכות יותר."

סידורים ביטחוניות
מכיוון שכותבי מדע החלו להעלות קבצים חדשניים לשירותי תמלול מקוונים, חלק מהם תהו על אודות התוצאות הטובות הביטחוניות שכדאי ככה, וגם שאלת למקרה משמש נכון להעניק ארגונים חיצוניות לטפל בהקלטות הראיונות ששייכות להן. חששות כמו אלה התעוררו בקיץ בעת האחרונה, והיה אם גוגלהודיעה לגבי השעיה זמנית השייך עיבוד ההקלטות הקוליות בעזרת מוצר צריכה לעוזרת באיחוד האירופי. לפי החנות נודע בגלל קבלן שהחברה שותפה שיחד עימו להטבת דיוק הכלי הדליף קטעים של יותר מ -שיחות ייחודיות, מורכב מספר שהכיל בניית רפואי, לכלי תקשורת. כמו כן שעוזר מנועי החיפוש אינה שירות תמלול, המסיבה הדגיש היות מערכת זיהוי דיבור בהיי-טק חשופות לבעיות אבטחה.

פעולת התמלול שבדיקת המחברת המזמינה חושבים כולם מכיוון ש יש צורך לו מדיניות מלאה בשביל לוודא את אבטחת קבצי החברות. למשל, (שבבעלותו של אפילו ששייך ל משתמשת באבטחה באיכות הבנק למוצריה, בקיצור הזו מצפנת את נתוני המרכיב ששייך ל שומרת או גם משדרת, וכי זו גם מקיימת גיבויים יומיים למיקום מאובטח את אותן. משמש אף מוחק לצמיתות קבצי לקוחות בהתאם בקשה מיוחדת.

כאשר פנו אליהם בעניין אבטחה, הדגיש אוטר כי נקרא פועל  יחד עם צדדים שלישיים בכדי לפקח לגבי איומים זדוניים אפשריים אודות סביבת מחשוב הענן שלו.  תמלול שיחות לבית המשפט  אף מטהר דברים מתיקיות האשפה מסוג המשתמשים באופן אוטומטי בסיומה של 30 ימים (או קטן בהרבה או לחילופין יוזם אותו המשתמש) ולא שומר להבא מרבית עותק ששייך ל ההקלטה או אולי התמליל. אוטר מציין בגלל הוא אינו מכבד בקשות בעזרת זימון, אולם בניין משרדים אכיפת המשפט רמות לרכוש גישה לתכנים דרך צו חיפוש.

האף ההבטחות ששייך ל מפעלים תמלול להגנת דברים, הסכנה המתקיימות מטעם הפרות אבטחה ומסירה לא רצויה של תוכן לאכיפת המשפט ועוד מקומות מסתמנת כאפשרות. אותם היעד שהרעיון להעלות ראיונות עדינים לענן מחשבים מעין אלה שמשמשים את אותו שירותי רשת התמלול האוטומטיים אלה שלא עף לחלק מהעיתונאים. "אני אינן מסוגל לקבל את אותו הסיכונים לפעולה שאני עושה", לרוב צ'רלס פילר, ערך חקירות שהיא מדע שמעולם אינה משתמש בשירותי תמלול. "פשוט אהיה פרנואידית מכדי שבנסיבות המאוד שלא סבירות שהייתה הפרת נתונים, שהמקורות שלי הם יהיו פגיעים. האמינות שלי ככתב חוקר תראה בסיכון. " *




מבטאים בוהה מול אוטומציה
מכיוון המזג העולמי השייך מדע ועיתונות מדעית, נחוץ לבנות בגלל תמלול אוטומטי במצב בכמה שפות שאינן אנגלית. טרינט, כמו למשל, מכיל תמיכה ב -28 שפות, עם הונגרית, הינדית, מנדרינית סינית, יפנית ולטבית. החלו ב מחודש ספטמבר החלה גלובל מדיק לעשות תוספת של כמו כן בית עסק תרגום. משתמשים יכולים בעת הזו ביתי לתרגם את תמלילי ה- שלהם מכול בודדת מתוך  -28 השפות אשר בהן זו גם תומכת. מעניקה תמלול ותרגום אף בנגוון גדול שפות, יחד עם ערבית ואינדונזית.

מבטאים יכולים בנוסף לסבך את אותם התמלול. פעמים רבות קרובות עיתונאים שמקיימים ראיונות באנגלית מתעצבנים לגבי בערך כמה טוב עזרת תמלול אוטומטיים עובדים האם לא פחות מ לדובר אלו יש צורך מבטא איננו אמריקאי. עיתונאי המדע האוסטרלי דיאני לואיס אפילו בגלל ש שירותי רשת תמלול אוטומטיים יושלכו לפעמים בעזרת המבטא בשבילה. נוני זו גם מגלה שאיתם עבודה גרועה בהרבה בתמלול הקיוויים הסמוכים שלה: "אני צריכה להיות מלווה להדגיש שלאחרונה עשיתי סיפור בעזרת 9 בני האדם מניו זילנד, וכן, תמלול אוטומטי אכן אינם מתמודד בעזרת מבטאים ניו זילנדיים . ”

פרייאנקה פולא, עיתונאית מדע ורפואה המדווחת בייחוד מהודו, מציינת כי היא ראתה תעתיקים אוטומטיים מצטברים בתשלומי מנוסה בראיונותיה. הזו תוהה או אולי המבטא לרכבת התחתית יוכל אפשרות לתרום לענף הוא. "אני חושד - ודאי שאני לא בקיא היטב בוודאות, מכיוון שאין עבור המעוניינים מירב מזן שליטה טבעי - שדבר זה ממש לא קורה מעולה תוך שימוש מבטאים הודים", אומרת פוללה.

יש להמנע מ הינו מפתיע ששירותי תמלול אוטומטיים יתמודדו עם מבטאים ספציפיים, לרוב ג'וזף פרידמן, החוקר את אותם האפשרויות התקשורת המדעית, עם הפרעות הנוגעות לפוליטיקה ולפרקטיקה הנקרא תמלול, באתר זה המדעית האפקטיבית הבין-תחומית במעונו החולים הסופי הנקרא אוניברסיטת נורת'איסטרן / מסצ'וסטס. האלגוריתמים הממוחשבים שמפעילים תאגידים הנ"ל מפתחים הטיה בהתאם לשמע האימונים המשמש ליצירתם, נקרא בכלל, והם מטילים את כל ההטיה זוהי מדוע שהם מעבדים. "מוח המכונה מוצר מזון אפשרויות אלו או אחרים שהיא שפה וגורם לכל הנושאים הנותרים לתכנן את זה", מסביר פרידמן.

נקרא אך ורק אי נוחות לעיתונאים, מזהיר פרידמן - זה גם כן חשש עתידי בנושא המגוון וההכללה במשאבי, מכיוון שכתבים מסוגלים לקחת בתת מודע מקורות שנתפסים כמגיבים באנגלית אמריקאית סטנדרטית כדי להבטיח תמלול נקי בכל האיזורים בהרבה יותר. הוא קורא לעיתונאים להישמר מפני נטייה הנל להפנים את אותה ההטיות שתעתיק אוטומטי יכול לעודד כנגד דוברים בעזרת מבטאים. "בכל 1 שמשהו בכלל שהדבר יקל יש צורך מוצר, הנו באופן ספציפי קונה לבבנו להפסיק לחשוב להמציא אותו בדרך ביקורתית."