กลยุทธ์การซื้อขาย ที่จะ ใช้ประโยชน์จาก บล็อก และข่าว ความเชื่อมั่น




สิ่งพิมพ์ที่คล้ายกัน กลยุทธ์การซื้อขายเพื่อใช้ประโยชน์จากบล็อกและข่าวความเชื่อมั่น Wenbin จางและสตีเว่น Skiena ภาควิชาวิทยาการคอมพิวเตอร์, มหาวิทยาลัย Stony Brook Stony Brook, NY 11794-4400 สหรัฐอเมริกา เราใช้สื่อเชิงปริมาณ (บล็อกและข่าวการเปรียบเทียบ) ข้อมูลที่สร้างขึ้นโดยขนาดใหญ่ประมวลผลภาษาธรรมชาติ (NLP) ระบบการวิเคราะห์ข้อความที่จะดำเนินการที่ครอบคลุมและ การศึกษาเปรียบเทียบวิธีการที่ บริษัท รายงานสื่อ fre - quency ขั้วและความเชื่อมั่นของผู้กระทำหรือคาดการณ์อีกครั้ง flects การซื้อขายหุ้นของปริมาณและผลตอบแทนทางการเงิน ของเรา การวิเคราะห์หลักฐานที่เป็นรูปธรรมให้ได้ว่าข้อมูลของสื่อเป็นอย่างมาก ข้อมูลตามที่แนะนำก่อนหน้านี้ในวรรณคดี - แต่ ไม่เคยเรียนในระดับของคอลเลกชันขนาดใหญ่หลายแห่งของบล็อก และข่าวมานานกว่าห้าปี การสร้างผลการวิจัยของเราเรา ให้ความเชื่อมั่นตามกลยุทธ์การซื้อขายในตลาดกลางซึ่ง ให้ผลตอบแทนที่ดีอย่างต่อเนื่องกับความผันผวนต่ำ ระยะเวลาห้าปี (2005-2009) ผลของเรามีความสำคัญใน ยืนยันประสิทธิภาพการทำงานของบล็อกทั่วไปและข่าวเซนเซอร์ วิธีการวิเคราะห์ timent มากกว่าโดเมนในวงกว้างและแหล่งที่มา นอกจากนี้ยังมีความแตกต่างที่โดดเด่นหลายครั้งระหว่างข่าวสารและ บล็อกจะมีการระบุในบทความนี้ บทนำ สมมติฐานตลาดที่มีประสิทธิภาพอ้างว่า มี.ค. การเงิน kets คือ "มีข้อมูลที่มีประสิทธิภาพ" ซึ่งหมายถึงปัจจุบัน ราคาหุ้นอยู่แล้วสะท้อนให้เห็นถึงข้อมูลที่รู้จักกันทั้งหมดและ ข้อเท็จจริงที่เกิดขึ้น นอกจากนี้ราคาในตลาดการเงินยกเลิก ลำเอียงและมีทั้งหมดภูมิปัญญาหรือการคาดการณ์ในอนาคตจาก นักลงทุน ดังนั้นนักลงทุนไม่สามารถทำให้ส่วนเกิน prof - จากตลาดหากกลยุทธ์การซื้อขายของพวกเขาจะขึ้นอยู่กับ ข้อมูลที่รู้จักกันเพราะราคาในตลาดจะมีประสิทธิภาพ การเก็บรวบรวมและการรวมข้อมูลต่างๆและการให้ การเปลี่ยนแปลงโดยไม่ชักช้า อย่างไรก็ตามขนาดใหญ่และเติบโตเอกสารวรรณกรรมที่ การเคลื่อนไหวของตัวชี้วัดทางการเงินที่ไม่เคยสอดคล้องกัน เต็นท์ที่มีมาตรการเชิงปริมาณของ บริษัท fundamen - ' ผลึก (เช่น (มีด Poterba และในช่วงฤดู​​ร้อนปี 1989 ม้วน 1988; ค 2010 สมาคมเพื่อความก้าวหน้าของเทียม หน่วยสืบราชการลับ (AAAI) สงวนลิขสิทธิ์. จะมีวิธีการที่เป็นไปได้และมีประโยชน์ในการวิเคราะห์ทางการเงิน เป้าหมายหลักของเราคือการศึกษาความสัมพันธ์ระหว่าง ข้อมูลการลงทุนในตลาดหุ้นและข้อมูลสื่อภาษาและบล็อก ข่าว andtoillustratetheextenttowhichthey​​cancontribute การออกแบบของกลยุทธ์การลงทุน contribu - หลักของเรา ทั้งนี้ในบทความนี้คือ: •การศึกษาเปรียบเทียบการบล็อกและข่าว - เราดำเนินการ การศึกษาเปรียบเทียบความคิดของสี่ linguis - ที่แตกต่างกัน แหล่งที่มากระตุกเช่น Twitter, Spinn3r บล็อก RSS, LiveJour - บล็อก NAL และ Dailies ข่าวการเปรียบเทียบ เราสั่ง ตัดความรู้สึกของพวกเขากับหุ้นที่สอดคล้องกันและ eval - uate ประสิทธิภาพการค้าส่วนได้เสียกับการใช้สี่ แหล่งที่มาตามลำดับ การวิเคราะห์ของเรายังค้นพบอีกมากมาย คุณสมบัติที่แตกต่างกันระหว่างบล็อกและข่าว ตัวอย่างเช่น, ข้อมูลข่าวสารอาจจะรวมอยู่ในราคาหุ้น ทันที (เกือบภายใน 1 วัน) หลังจากที่ปล่อยในขณะที่บล็อก ข้อมูลเช่นทวิตเตอร์จะถูกดูดซึมโดยตลาดหุ้น ที่มีระยะเวลานาน (ประมาณ 2 ถึง 3 วัน) •การวิเคราะห์ขนาดใหญ่ - เราจะให้ผลที่ครอบคลุมของ การวิเคราะห์การลงทุนในตลาดหุ้นโดยใช้ประมาณหนึ่งเทราไบต์ของบล็อก และข้อมูลข่าวสารและหลายพัน บริษัท ที่แตกต่างกัน นี้ ขนาดของการวิเคราะห์ที่ไม่เคยมีความพยายามก่อนหน้านี้ใน theliterature, andenablesustoidentifyshort-termbutsta - tistically ความสัมพันธ์ที่สำคัญระหว่างปริมาณสื่อ / ความเชื่อมั่นและผลตอบแทนทางการเงิน / ปริมาณการซื้อขาย •คอร์ปัสขนาดเรื่อง - การทำงานก่อนหน้าความเชื่อมั่นตาม การวิเคราะห์ทางการเงิน (เช่น (Tetlock, ซาร์ Tsechansky และ Macskassy 2007)) มุ่งเน้นอย่างชัดเจนในระดับชาติทางการเงิน หนังสือพิมพ์คือดาวโจนส์ข่าวบริการและ WallStreetJournal อย่างไรก็ตาม wedemonstratethatamore อย่างมีนัยสำคัญสัญญาณความเชื่อมั่นที่เชื่อถือได้มาจาก analyz - •การตรวจสอบของวิธีการวิเคราะห์ความเชื่อมั่น - บางที an - ผลงานที่สำคัญอื่น ๆ ของกระดาษของเราเป็นที่แข็งแกร่ง ตรวจสอบวันที่ของความถูกต้องของความเชื่อมั่นของเราสื่อ วิธีการวิเคราะห์ของลิเดีย การตรวจสอบที่เหมาะสมเป็นญ เป็นไปได้ในกรณีที่ไม่มีการใด ๆ ตามที่ตกลงกันมาตรฐานทองคำ สำหรับวิเคราะห์ความเชื่อมั่นในระดับนิติบุคคล (ปางและลี 2008) แต่ความสามารถของเราที่จะดึงความเชื่อมั่นเชื่อถือเพียงพอ สัญญาณประสบความสำเร็จในการซื้อขายเมื่อ (โดยไม่คำนึงถึงระยะเวลา ความละเอียด) มีหลักฐานเข้มงวดที่ความเชื่อมั่นของเรา วิธีการอย่างถูกต้องสะท้อนให้เห็นถึงการเปลี่ยนแปลงที่แท้จริงในการตอบสนองต่อ lin - ข้อมูล guistic กระดาษนี้จะมีการจัดระเบียบดังต่อไปนี้ ครั้งแรกที่เราตรวจสอบอีกครั้ง ทำงาน lated จากนั้นเราจะอธิบายกำเนิดและลักษณะ ของสื่อและข้อมูลทางการเงินที่เราทำงานด้วย หลังจากที่เรา ให้การวิเคราะห์ที่สมบูรณ์ของความสัมพันธ์ระหว่างรายใหญ่ ตัวแปรตลาดหุ้นและตัวแปรสื่อหลักซึ่งเป็น ส่วนที่สำคัญที่สุดของบทความนี้ สุดท้ายเรานำเสนอ และประเมินผลกลยุทธ์การซื้อขายในตลาดกลางขึ้นอยู่กับการเลื ข้อมูลขนาดเส้นผ่าศูนย์กลาง เราสรุปได้ว่าราคาที่ทางการเงินอย่างมีนัยสำคัญ มีความสัมพันธ์กับข้อมูลสื่อเชิงปริมาณและสามารถใช้ในการ กำหนดกลยุทธ์การซื้อขายที่น่าสนใจ งานที่เกี่ยวข้อง การทำงานก่อนหน้าเป็นตัวแบ่งแยกระหว่างการเงินและคอมพิวเตอร์ วิทยาศาสตร์ชุมชนวิชาการ เราวิจัยเชิงสำรวจครั้งแรก จากดินแดนทางการเงิน Tetlock (Tetlock, ซาร์ Tsechansky และ Macskassy 2007) สำรวจว่าการเกิดขึ้นของคำพูดในเชิงลบ บทความข่าว บริษัท เฉพาะสามารถช่วยให้เราทำนายเงินสด บริษัท ' ไหลและไม่ว่า บริษัท 'ราคาตลาดหุ้นรวม ข้อมูลภาษาได้อย่างมีประสิทธิภาพ พวกเขาอ้างว่า บริษัท ' ราคาหุ้นที่อยู่ภายใต้การตอบสนองต่อข้อมูลที่เชิงลบต้นแบบ การของบทความข่าว โดยเฉพาะอย่างยิ่งข้อมูลที่เชิงลบ การในบทความข่าวจะสะท้อนให้เห็นในราคาตลาดหุ้นด้วย ความล่าช้าประมาณหนึ่งวัน จันทร์ (จัน 2003) ตรวจสอบผลตอบแทนรายเดือนเพื่อย่อย ของหุ้นหลังจากที่มีข่าวของประชาชนเกี่ยวกับพวกเขาจะถูกปล่อยออกและพบว่า ที่นักลงทุนตอบสนองช้าไปข้อมูลโดยเฉพาะอย่างยิ่งหลังจากที่ ข่าวร้าย. อีกประการหนึ่งที่สำคัญคือการค้นพบว่าหุ้นมีแนวโน้มที่จะ การกลับรายการในเดือนถัดไปหลังจากที่ราคามากมูฟ ments เดียวกับข่าวที่สาธารณะ นอกจากนี้ รูปแบบมีนัยสำคัญทางสถิติ ข้อ จำกัด นี้ การศึกษาใช้หยาบเมล็ดรายเดือน ในกระดาษของเราเรา ให้การวิเคราะห์ข่าวประจำวันและการเคลื่อนไหวของราคา Antweiler และแฟรงก์ (Antweiler และแฟรงก์ 2004) การศึกษา มากกว่า 1.5 ล้านข้อความจาก Yahoo! การคลังและ Raging Bull ซึ่งเป็นสองหุ้นอินเทอร์เน็ตที่นิยมมากที่สุด บอร์ดข้อความ พวกเขามีงานทำหน่อมแน้มเบส์และการสนับสนุน เครื่องเวกเตอร์ลักษณนามในการประเมิน "bullishness" เนื้อหาของ ข้อความเหล่านี้หุ้น พวกเขาแสดงกระดานข้อความเหล่านี้เป็น ข้อมูลมากและต่อไปว่า bullishness เป็นบวก และที่เกี่ยวข้องกับผลตอบแทนที่มีนัยสำคัญ ในแง่ของการซื้อขาย ปริมาณกระดาษที่แสดงความคิดเห็นที่ขัดแย้งจะ associ - ated กับการซื้อขายมากขึ้น จากด้านวิทยาการคอมพิวเตอร์เป็นงานวิจัยที่รุนแรง จัดส่งโดยการทำเหมืองข้อความหรือเครื่องเรียนรู้ชุมชน แนวคิดพื้นฐานของพวกเขาคือการวัดปริมาณข้อมูลที่มีภาษา เทคนิคการทำเหมืองข้อความที่ได้รับการตั้งค่าที่กำหนดไว้ล่วงหน้าของคุณสมบัติของ ข้อมูลการฝึกอบรมและสร้างรูปแบบต่างๆที่มี classi - วิธีการทางสถิติเสียหรือการเรียนรู้ขั้นตอนวิธีการทางสถิติ การสำรวจรายละเอียดของการทำเหมืองข้อความสำหรับการตอบสนองตลาด ข่าวสามารถพบได้ใน (Mittermayer และ Knolmayer 2006a) โดยเฉพาะอย่างยิ่งรูปแบบ 3 หมวดหมู่ใช้กันอย่างแพร่หลาย เอกสารป้ายชื่อหรือคำ ประเภทแรก (บวก ความเชื่อมั่น) ประกอบด้วยบทความข่าวหรือคำที่ทำให้ ตัวแปรทางการเงินที่เกี่ยวข้องเพิ่มขึ้นในระดับหนึ่งใน ช่วงระยะเวลาหนึ่งเช่นเหตุการณ์ข่าวที่ทำให้ ราคาของหุ้นเดียว "ไอบีเอ็ม" เพิ่มขึ้น 0.5% ในไปนี้ ควายเหล็กวัน ในทำนองเดียวกันประเภทที่สอง (เซนเซอร์เชิงลบ timent) จะถูกกำหนดตามความเหมาะสม ประเภทที่สามประกอบด้วย จากบทความข่าวที่เป็นกลางหรือคำ โดดเด่นภายใต้รูปแบบนี้รวมถึง (ฝั่งยูและลำ 2002; Mittermayer และ Knolmayer 2006b; โทมัส 2003; Wuthrich โชและอื่น ๆ 1998) นอกจากนี้ยังได้รับความสนใจอย่างมากในความเห็น การทำเหมืองแร่และชุมชนของ NLP ในการใช้กระแสข้อความการเงิน ที่นี่เราจะอธิบายหุ้นและแหล่งข้อมูลสื่อซึ่งเป็น พื้นฐานสำหรับการวิเคราะห์ของเราในบทความนี้ ข้อมูลสต็อกสินค้า ราคาหุ้นของเราและข้อมูลปริมาณจะได้รับจาก Thom - ข้อมูลสื่อ บล็อกของ บริษัท ที่เกี่ยวข้องกับข่าวและข้อมูลที่ถูกสร้างขึ้น US - ไอเอ็นจีลิเดีย ((ลอยด์ Kechagias และ Skiena 2005) textmap) ซึ่งเป็นงานระบบประมวลผลข้อความความเร็วสูง