Khái lược

Nhiều người tin rằng tính năng tìm kiếm của Google có thể khám phá hầu hết thông tin sẵn có trên internet, nhưng có một thế giới online hoàn chỉnh nằm ngoài tầm với của Google hay bất kỳ bộ máy tìm kiếm nào.

Kích thước Internet ở thế giới ngầm dường như là vô tận. Số lượng web site không được index, được gọi là Deep Web, ước tính gấp 400 đến 500 lần những web site được index mà chúng ta có thể tìm kiếm được bằng các công cụ tìm kiếm thông thường. Và Deep Web là nơi mà mặt tối của Internet mặc sức tung hoành. Trong khi rất nhiều công dân có ý thức và tuân thủ pháp luật (nhà báo, nhà hoạt động chính trị, …) điều hành các hoạt động của họ ở đây, thì một phần không nhỏ của Deep Web – được gọi là Darknet lại trở thành cầu nối cho các hoạt động nguy hiểm và bất hợp pháp.

Tài liệu tóm lược này phác thảo về những gì được gọi là Deep Web và Darknet, làm sao để truy cập, và tại sao chúng ta nên quan tâm. Với những nhà hoạch định chính sách, sự tăng trưởng không ngừng nghỉ của của Deep Web nói chung và việc mở rộng nhanh chóng của Darknet là những thách thức đầy mới mẻ. Việc đối phó với những thách thức này có ý nghĩa sâu sắc với quyền tự do dân sự, an ninh quốc gia và nền kinh tế toàn cầu nói chung.

Bề nổi của Darknet

Mặc dù khái niệm Deep Web và Darknet đã tồn tại từ thập niên 90, khi mà World Wide Web bắt đầu trở nên phổ biến, sự phát triển của chúng lại không nhận được quan tâm trước khi vụ bắt giữ “Dread Pirate Roberts” (1), tên thật là Ross William Ulbricht, vào tháng 10 năm 2013. Ulbricht sáng lập và điều hành web site “Silk Road” (Con đường tơ lụa), được xem là chợ đen buôn bán hàng cấm, đặc biệt là thuốc phiện. FBI ước tính Silk Road đã xử lý hơn 1.2 tỷ đô la giao dịch vào tháng 7 năm 2013, bao gồm 150.000 khách hàng và khoảng 4000 nhà cung cấp. Deep Web và Darknet nhanh chóng trở thành công cụ trong văn hóa đại chúng, đóng vai trò chính trong bộ phim truyền hình Mỹ – House of Cards (Sóng gió chính trường), nơi một phóng viên sử dụng nó để thuê một hacker khai thác những bí mật của phó tổng thống. Gần đây hơn, Deep Web cũng là đề tài cho bộ phim tài liệu của Alex Winter kể về Ulbricht, người bị kết án với hàng loạt các tội phạm liên bang liên quan đến hoạt động ở chợ đen của y.

Đây không phải lần đầu tiên Hollywood đóng vai trò quan trọng trong việc phơi bày các vấn đề xung quanh các công nghệ mới nổi. Điện ảnh và truyền hình đã khám phá các tác động xã hội tiềm tàng của tiến bộ công nghệ, từ xe tự lái để thăm dò không gian đến công nghệ sinh học và trí tuệ nhân tạo. Với Deep Web, Hollywood đi trước các cộng đồng học thuật và chính sách trong việc nâng cao tầm nhận thức của công chúng về những tác động đa diện của việc phát triển bùng nổ những web site không được index. Nhưng các nhà hoạch định chính sách và học thuật phải bắt kịp điều đó. Trong tài liệu này, chúng tôi giới thiệu về Deep Web và Darknet, cách truy cập và tại sao chính quyền nên quan tâm đến nó.

Định nghĩa Deep Web và Darknet

Nếu chúng ta xem Web như một đại dương dữ liệu, hầu hết chúng ta đang tương tác với các con sóng, minh bạch, dễ điều hướng – Surface Web (Web nổi). Surface Web là một phần Web đã được crawl và index bởi các bộ máy tìm kiếm tiêu chuẩn như Google hay Bing. Phần bóng tối phía dưới đại dương, nằm phía dưới tầng Thermocline, là vùng biển sâu không đáy của Deep Web (hay còn được gọi là Invisible Web hay Hidden Web) – phần Web không được crawl hoặc index, và bởi vậy chúng nằm ngoài định vị của các bộ máy tìm kiếm tiêu chuẩn. Về cơ bản thì ta không thể ước lượng chính xác kích cỡ của Deep Web. Tuy nhiên, người ta cho rằng Google – bộ máy tìm kiếm lớn nhất hiện nay – chỉ index được 4-16% Surface Web. Deep Web lớn xấp xỉ 400-500 lần Surface Web. Ước tính rằng dữ liệu được lưu trữ trên 60 web site lớn nhất Deep Web gấp 40 lần kích thước của toàn bộ Surface Web (thehiddenwiki.net).

Phát triển nhanh chóng nhất trong Deep Web phải kể đến Darknet (hay còn gọi là Dark Web, Dark Net hay Dark Internet). Ban đầu, Darknet dùng để chỉ những máy chủ không thể truy cập bởi Internet. Tuy nhiên, khi người dùng của những máy chủ này bắt đầu chia sẻ file qua các mạng phân tán không được index bởi bộ máy công cụ tìm kiếm tiêu chuẩn, Darknet trở thành một phần quan trọng của Deep Web. Không như Surface Web hoặc phần lớn các web site của Deep Web, hầu hết các web site Darknet chỉ có thể truy cập ẩn danh.

Một nghiên cứu sơ bộ tiết lộ rằng Deep Web thực sự chứa nguồn thông tin mới nhất trên Internet. Những website này thường chỉ tập trung vào một vài thể loại, nhưng chất liệu nội dung lại sâu sắc hơn những trang web ở Surface Web. Hơn nữa, chính vì hầu hết nội dung đều được bảo vệ, tổng thể chất lượng nội dung từ Deep Web tốt hơn và giá trị hơn so với Surface Web. Một ước tính cho rằng hơn 50% nội dung của Deep Web được chứa trong các đường dẫn theo chủ đề, khiến chúng dễ tiếp cận hơn.

Nhiều công nghệ, như ubiquitous computing, distributed/cloud computing, mobile computing, và sensor network, đã góp phần vào việc mở rộng Deep Web. Những tiến bộ trong dịch vụ secure/anonymous web hosting, cryptocurrency/dark wallet, và phần mềm tội phạm đang tiếp tục đóng góp vào sự phát triển của Darknet. Một loạt các đơn vị tiền tệ mã hóa như Bitcoin, Darkcoin hoặc Peercoin (2) đã được sử dụng cho các giao dịch ẩn danh được tiến hành trong và xuyên suốt hầu hết các thị trường Darknet. Hacker được thuê và các call center đa ngôn ngữ cũng đã thúc đẩy sự phát triển của Darknet. Tất nhiên, có nhiều nhà báo, nhà chính trị, whistle-blower (3), và những người ủng hộ nhân quyền sử dụng Darknet hợp pháp. Không ngạc nhiên khi Chelsea (tức Bradley) Manning, Julian Assange, và Edward Snowden (4) đều sử dụng Darknet cho các hoạt động của họ.

Làm thế nào để truy cập Deep Web và Darknet

Để khám phá Deep Web và Darknet, chúng ta cần một số công cụ và kỹ thuật đặc biệt. Một vài trong số chúng tương tự hoặc liên quan chặt chẽ đến những thứ chúng ta dùng để khai phá Surface Web. Tùy vào mục đích của mỗi cá nhân, các công cụ và kỹ thuật khác nhau sẽ đạt được những độ sâu khác nhau. Với hầu hết người dùng, nói chung có hai cách tiếp cận khác nhau để truy cập Deep Web và Darknet:

  • Sử dụng bộ máy tìm kiếm đặc biệt từ các trình duyệt thông thường như Internet Explorer, Firefox, Chrome, Safari…
  • Sử dụng bộ máy tìm kiếm đặc biệt chỉ truy cập được từ trình duyệt TOR Một cách dễ dàng để truy xuất đến Deep Web là sử dụng một bộ máy tìm kiếm đặc biệt được thiết kế riêng cho mục đích này. Những bộ máy tìm kiếm thay thế này được xây dựng để truy xuất đến những phần khác nhau của Deep Web, nhưng thách thức là tất cả các bộ máy tìm kiếm được phát triển cho đến nay chỉ có thể crawl hoặc index một phần nhỏ của Deep Web, bởi vậy sử dụng những trang liệt kê hidden web vẫn rất cần thiết (chẳng hạn https://sites.google.com/site/howtoaccessthedeepnet/working-links-to-the-deep-web). Vì những website này không được index, chúng sẽ không thể tìm được bằng cách thông thường. Tuy nhiên, URL của chúng có thể tìm thấy bằng một số phương pháp, khi biết URL thì ta có thể truy cập một số trang của Deep Web bằng trình duyệt web thông thường.

Một số cơ sở dữ liệu công khai được xem là một phần của Deep Web vì hầu hết nội dung của chúng không thể crawl hoặc index bởi bộ máy tìm kiếm. Với hầu hết người dùng, họ có thể tương tác thường xuyên với một phần của Deep Web mà không nhận thức được. Chẳng hạn, đường dẫn của Thư viện Quốc hội Hoa Kỳ (https://www.loc.gov) là một cơ sở dữ liệu trực tuyến cư trú trên Deep Web. Các trang web khác sử dụng Deep Web bao gồm những trang dữ liệu kinh tế như FreeLunch.comCensus.govCopyright.gov, PubMed, Web of Science, Directory of Open Access Journals, FindLaw và Wolfram Alpha.

Ngoài những cơ sở dữ liệu sẵn có trên thì còn rất nhiều cơ sở dữ liệu trả phí sử dụng Deep Web. Người dùng chỉ có thể truy cập đến những cơ sở dữ liệu này bằng cách đăng ký tài khoản. Bên cạnh đó, có một lượng lớn thông tin riêng tư (như tài khoản tín dụng và Paypal) cũng được lưu trữ trên Deep Web.

Với sự phổ biến của Web 2.0 và thiết bị di động thông minh (smartphone), một lượng lớn thông tin được lưu trữ trên các mạng xã hội không thể truy cập bằng các bộ máy tìm kiếm thông thường, phần lớn mạng xã hội đều yêu cầu người dùng xác thực và được cấp quyền để truy xuất dữ liệu. Một số trang như Twitter và Facebook cung cấp API để người dùng có thể lấy thông tin. Nhưng nhiều trang như YikYak hay Wechat hạn chế khả năng truy xuất dữ liệu của người dùng đến cơ sở dữ liệu khổng lồ của họ với lý do bảo mật và riêng tư.

Darknet ngày càng được sử dụng nhiều trong giao dịch, đàm thoại, chia sẻ file và thông tin trong những năm gần đây vì người dùng có thể duy trì ẩn danh, đảm bảo hoạt động trực tuyến được bảo mật. Để truy cập đến những trang ẩn danh của Deep Web, người dùng phải sử dụng trình duyệt TOR (5) để truy cập website có tên miền là “.onion”. Khác với trình duyệt dùng cho Surface Web, trình duyệt TOR cho phép người dùng kết nối ẩn danh đến trang web, khiến cho việc lần vết trở nên cực kỳ khó khăn. Các trang Darknet trên mạng TOR thường không đáng tin cậy, thỉnh thoảng lại “chết” trong vài giờ hoặc vài ngày, cũng có thể là biến mất vĩnh viễn. Những trang này có tốc độ tải trang rất chậm, bởi vì TOR phải định tuyến kết nối thông qua những server được chọn lựa một cách ngẫu nhiên nhằm đảm bảo ẩn danh. Trình duyệt TOR đã có ứng dụng cho các thiết bị Android và iOS, tuy nhiên chúng đều có tính năng bảo mật kém và được đề nghị không nên sử dụng. Tương tự, add-on TOR cho các trình duyệt khác cũng không an toàn và không được hỗ trợ bởi TOR, bởi vậy cũng được khuyến khích không sử dụng.

Từ sau vụ bắt giữ Ulbricht năm 2013, hàng tá phiên bản thay thế “Silk Road” nổi lên. Một phiên bản mới và cải tiến của Silk Road, được gọi là Silk Road 2.0, nổi lên và đã bị đóng cửa một lần nữa bởi cơ quan pháp luật vào tháng 11 năm 2013. Hình dưới đây liệt kê một số mẫu thuộc thể loại “Drugs” trên chợ đen Agora Darknet, một trong số đó có cả MDMA, cocaine, oxycodone, heroin. Tương tự eBay và Amazon, người bán nhận điểm feedback từ khách hàng, bao gồm cả comment về chất lượng sản phẩm, thời gian giao hàng và những số liệu thương mại điện tử liên quan khác.  Trong khi Darknet nổi tiếng với các hoạt động bất hợp pháp, có không ít người sử dụng nó cho mục đích hợp pháp. Một số dựa trên khái niệm quen thuộc, chẳng hạn chia sẻ ảnh nhằm tận dụng lợi thế bảo mật của Deep Web. Những cái khác thì có phần độc nhất ứng với văn hóa của Deep Web, đó là những site whistleblowing, ebooks về việc lật đổ chế độ. Cánh nhà báo sử dụng SecureDrop hoặc GlobalLeaks để chia sẻ tập tin qua mạng TOR. Những tài khoản public cho thấy Chelsea Manning, Julian Assange, và Edward Snowden đều dùng mạng TOR như một cách để chia sẻ những tập tin khổng lồ về chính phủ Hoa Kỳ trước khi chúng rò rỉ trên mạng.

Để chống lại các hoạt động bất hợp pháp trên Darknet, nhiều nhóm thi hành luật đã được luyện tập và thực hành các kỹ thuật của tội phạm trực tuyến và kỹ thuật lần vết mạng, tương tự hoặc giống hệt với các kỹ thuật hacking thông thường. Để xuyên qua lớp tường ẩn danh dày đặc được cung cấp bởi TOR, FBI đã sử dụng một ứng dụng cực mạnh được là Metasploit trong “Torpedo”, một chiến dịch năm 2012 chống lại người dùng của ba website khiêu dâm trẻ em ở Darknet. FBI cũng tham gia một chiến dịch quốc tế có tên là “Onymous” sử dụng malware và các kỹ thuật hacking tương tự. Dùng những kỹ thuật này để nghiên cứu Deep Web và Darknet làm dấy lên mối lo ngại về tính pháp lý và đạo đức do việc vi phạm quyền riêng tư của các đề án nghiên cứu. Các nhà nghiên cứu có nguy cơ biến chất dù họ theo đuổi các đề tài hợp lệ.

Tổng kết

Với những nhà hoạch định chính sách, sự xuất hiện của Deep Web nói chung và Darknet nói riêng cung cấp một hệ sinh thái kinh tế, xã hội và chính trị mới, được thiết kế để tồn tại – và thường hoạt động – nằm ngoài tầm với của pháp luật, quy định và giám sát của chính phủ. Nếu nhà làm luật muốn hiểu Deep Web và Darknet, họ sẽ cần tập trung vào nó và đi xa hơn là chỉ dừng lại ở những phương pháp tìm kiếm Internet thông thường.

Deep Web và Darknet cũng giống như vùng đất chưa được khai phá, mặc dù đã có những bước tiến đáng kể nhưng vẫn tồn tại một dải đất lớn mà chúng ta chưa biết tới. Với những công cụ tìm kiếm như Google hay Bing, những gì chúng ta có thể truy cập chỉ là một phần bề nổi nhỏ bé trên đại dương. Thực tế vẫn còn rất rất nhiều vùng đất rộng lớn trên internet mà chúng ta chưa thể khám phá được.

Liệu chúng ta có thể chạm tới đáy và hiểu thấu được về Deep Web cũng như Darknet? Vào thời điểm hiện tại chúng tôi nghĩ đây là vấn đề thiếu tính khả thi, về cả khía cạnh kỹ thuật cũng như pháp lý, nhưng chắc chắn rằng điều này cần được tranh luận công khai và thảo luận trên nhiều khía cạnh về tác động của Deep Web, vì một phần của nó càng ngày càng chìm trong bóng tối không thể kiếm soát. Việc làm thế nào để cân bằng giữa quyền tự do dân sự và những mối quan tâm về an ninh quốc gia vẫn còn là một thách thức khó khăn cho chính quyền trong thời đại của Big Data và Deep Web.

Lược dịch từ THE DEEP WEB AND THE DARKNET: A LOOK INSIDE THE INTERNET’S MASSIVE BLACK BOX – by Daniel Sui, James Caverlee, Dakota Rudesill – Wilson Center

(1) – https://en.wikipedia.org/wiki/Ross_Ulbricht 

(2) – http://coinmarketcap.com 

(3) – https://vi.wikipedia.org/wiki/Whistleblower 

(4) – https://wikileaks.org/ 

(5) – The Onion Router – (Tor Project)