BrowserOS, Comet ve Atlas ile rekabet etmeyi amaçlayan, web'i otomatikleştiren açık kaynaklı, aracı tarayıcıdır.

  • BrowserOS, Chromium'un bir çatalında yerel AI ajanlarını çalıştırır, varsayılan olarak gizlilik ve uzantı desteği sunar.
  • Tarayıcı otomasyonunu MCP sunucuları ve herhangi bir LLM (OpenAI, Anthropic veya Ollama/LM Studio gibi yerel seçenekler) ile birleştirin.
  • Kurumsal web uygulamalarında gerçek görevler için yeniden kullanılabilir aracıların "ofisi"nin tarayıcı olduğu bir vizyon önermektedir.
  • %100 açık kaynaklı proje (AGPL-3.0), aktif topluluk ve net odak: bulutta değil, tarayıcıda pratik yapay zeka.

Tarayıcı İşletim Sistemi

BrowserOS'u duyduysanız ve neden bu kadar çok insanın "beyinli tarayıcı"dan bahsettiğini merak ediyorsanız, işte size tam resim. BrowserOS, doğal dildeki talimatları anlayıp yürütebilen yapay zeka ajanlarını bünyesinde barındıran açık kaynaklı bir tarayıcıdır.Oturum açmış olduğunuz oturumları ve yerel erişimi kullanarak sizin adınıza tıklama, yazma ve gezinme. Tüm bunlar, varsayılan gizlilik yaklaşımıyla ve kişisel verileriniz için bulut altyapısına güvenmeden.

Bu öneri tarayıcı dünyasındaki sıradan bir fikir değil: BrowserOS, Chrome uzantılarınızla uyumluluk ve net bir hedefle Chromium'un bir çatalı olarak doğdu: çözümlere açık ve gizlilik odaklı bir alternatif olmak Atlas (ChatGPT)Geleneksel tarayıcılara ek olarak Comet (Perplexity) veya Dia. Fikir basit ve etkisi güçlü: Görevi siz tanımlıyorsunuz ve bir aracı, sizin kimlik bilgilerinizle ve geçmişinizi üçüncü taraflara göndermeden kendi bilgisayarınızdan gerçekleştiriyor.

BrowserOS nedir ve nasıl farklıdır?

Özünde, BrowserOS, yapay zeka ajanlarını doğal olarak çalıştıran bir tarayıcıdır.Talimatları sanki bir meslektaşınıza anlatıyormuşsunuz gibi yazmanıza olanak tanır ve sistem, işlem sırasını gerçekleştirir: sayfaları açma, arama başlatma, formları doldurma veya veri çıkarma. Tarayıcınıza "bakan" harici bir asistan değildir: aracılar BrowserOS'un içinde bulunur.

Çünkü Chromium üzerine inşa edilmiştir, deneyim ilk dakikadan itibaren tanıdık geliyorTanıdık bir arayüz, eklentilerle uyumluluk, Chrome veri aktarımı ve ekosisteme aşina olanlar için neredeyse anında benimsenme. Bu "evdeymiş gibi hissetme" etkisi, günlük kullanımdan ödün vermeden otomasyona başlarken yaşanan sorunları azaltır.

Neden şimdi: Tarayıcıda aracıların zamanı geldi

Son aylarda yapay zeka destekli programlama araçları geliştiricilerin üretkenliğini kat kat artırdı. Ancak milyonlarca bilgi çalışanı tekrarlayan tarayıcı görevlerinde takılıp kalıyorKopyalama ve yapıştırma, form doldurma, gösterge tablosu verilerini dışa aktarma, kampanya başlatma vb. Günlük bir darboğaz.

BrowserOS ekibi, Netscape günlerinden bu yana ilk kez, Tarayıcıyı gerçek iş için yeniden tasarlama fırsatımız varYapay zeka zaten tüm projeleri "yazıyorsa", neden sizin her zaman kontrolde olmanıza gerek kalmadan düğmelere basamıyor, bir web arayüzünde gezinemiyor veya eylemleri sizin yaptığınız gibi birleştiremiyor?

BrowserOS'un ele aldığı sorunlar

BrowserOS'tan önce, ajanların gerçek dünya görevlerinde konuşlandırılması çok özel nedenlerden dolayı başarısız oluyordu. Proje, yaygın olarak benimsenmesini engelleyen üç temel engeli tespit ediyor.özellikle şirketlerde:

  • Kimliği doğrulanmış oturumlara erişimBirçok aracı çözüm uzak makinelerde çalışır ve gerçek hesaplarınızla (Gmail, LinkedIn, kurumsal araçlar) çalışamaz. Sonuç olarak, gerçek dünyadaki görevlerde yetersiz kalırlar.
  • Alet parçalanmasıBazı aracılar MCP sunucularıyla iletişim kurar, bazıları yalnızca web otomasyonu gerçekleştirir ve bazıları da Zaps gibi API'leri birbirine bağlar. Eksik olan şey, karmaşık akışlar oluşturmak için birleşik bir "araç kutusu"dur.
  • Kara kutu ve kilitBirçok popüler tarayıcı arama veya reklam ürünüdür. İstemlerini veya iç işleyişlerini açmıyorlarSize belirli bir LLM derecesi atarlar ve verileri sunucularına yönlendirirler. Birçok şirket için bu kesinlikle hayır.

BrowserOS en baştan itibaren yanıt veriyor: bilgisayarınızda çalışan tarayıcınızdaki aracılarMCP ve otomasyonu birleştiren ve istediğiniz zaman denetleyebileceğiniz ve çatallayabileceğiniz %100 açık bir felsefe altında bu kombinasyon, şimdiye kadar tarayıcıda ciddi işleri yapay zekaya devretmenin imkansız olduğu sorunu çözüyor.

BrowserOS nasıl çalışır ve ilk adımlar

Akış doğrudandır: BrowserOS'u diğer tarayıcılar gibi indirip kurarsınızGünlük kullandığınız sitelere giriş yapar ve görevleri doğal dilde tanımlarsınız. Aracı, gerçek dünya bağlamınızda, izinleriniz ve etkin oturumlarınızla, sanki ekranın önündeymişsiniz gibi hareket eder.

  1. İndirme ve yükleme Sisteminiz için BrowserOS (macOS, Windows ve Linux için mevcuttur). Linux'a kurulum konusunda endişeleriniz varsa, AppImage olarak mevcuttur. GitHub'da.
  2. Chrome verilerinizi içe aktarın Yer imlerini, geçmişi veya ayarları saklamakla ilgileniyorsanız.
  3. Yapay zeka sağlayıcınızı bağlayın: OpenAIOllama/LM Studio üzerinden kendi anahtarlarınızla antropik veya yerel modeller.
  4. Otomatikleştirmeye başlayın: Hedefleri metin halinde formüle edin ve aracının adımları web üzerinde yürütmesine izin verin.

Ayrıca tarayıcı otomasyonunu MCP sunucularıyla birleştirin ve API çağrılarını aynı akışta birleştirir. Bu kombinasyon, verileri toplayıp bir modelde işleyebilen ve elektronik tabloları veya SaaS araçlarını güncelleyebilen, tüm bunları tek bir aracıyla zincirleme olarak gerçekleştirebilen asistanlar oluşturmanıza olanak tanır.

BrowserOS'un fark yaratan temel özellikleri

  • Doğal dilde yapı ajanlarıProgramlama yapmadan istediğini söyle.
  • Model özgürlüğüAnahtarlarınızı getirin ve LLM'ler arasında geçiş yapın veya yerel modelleri çalıştırın.
  • Bu "normal" bir tarayıcıdır: Krom bazlı, Chrome eklentileriniz çalışıyor mu?.

Gizlilik tasarımın temel taşlarından biridir: Verileriniz, geçmişiniz ve oturumlarınız bilgisayarınızda kalır.İstilacı telemetri veya harici bulutlara bağımlılık olmadan. İsterseniz, yalnızca yerel modellerle çalışabilir ve musluğu tamamen kapatabilirsiniz.

Sorunları daha kötü hale getirmek için, Yapay zeka destekli bir reklam engelleyici üzerinde çalışıyorlar Statik filtrelerden daha karmaşık senaryoları kapsamayı vaat ediyor. Geliştiriciler ve ileri düzey kullanıcılar için, tarayıcıyı bir MCP sunucusu olarak kullanma ve aşağıdaki gibi araçlarla entegre etme desteği de mevcut: claude-code o gemini-cli.

Entegrasyonlar, MCP ve harici araçlardan kullanım

En güçlü varlıklarından biri de şudur: BrowserOS bir MCP sunucusu olarak çalışabilirBu, protokolle uyumlu diğer uygulamaların (bahsedilenler gibi) claude-code o gemini-cliTarayıcınızla "konuşabilirler" ve web arayüzü görevlerini kendi temsilcilerine devredebilirler.

İlginç olan orkestrasyondur: Tarayıcıyı otomatikleştirmek veya bir API çağırmak arasında seçim yapmanıza gerek yok.Her ikisini de aynı aracı reçetesinde yapabilirsiniz. Örneğin, karmaşık bir kullanıcı arayüzüne sahip bir portaldan veri alabilir, bir modelle işleyebilir ve ardından sonuçları manuel olarak araçları karıştırmadan bir elektronik tabloya veya CRM'e yükleyebilirsiniz.

Chrome, Brave, Arc/Dia ve Perplexity Comet ile hızlı karşılaştırma

Chrome ile karşılaştırıldığında

Chromium'un açık kaynaklı olması sayesinde BrowserOS temelleri devralıyor, ancak Chrome, otomasyon için yıllardır önemli yerel yapay zeka geliştirmeleri yapmadı.MCP olmadan, yerel aracılar olmadan, o entegre orkestrasyon katmanı olmadan, sadece harika bir tarayıcı olarak kalır... "tıklama-size yardımcı" olmadan.

Cesurla Yüzleşmek

Cesur, gizlilikte yolu açtı, ancak Odak noktaları kripto, arama, VPN'ler ve daha fazlası arasında bölünmüştür.BrowserOS kendi işini yapıyor: Tarayıcıda yapay zeka ve gerçek iş otomasyonu.

Karşılıklı Ark/Çap

Birçok kişi Arc'ın teklifini takdir etti, ancak Kodunu kapattı ve kullanıcıları belirsizliğe sürükledi.BrowserOS'ta ise durum tam tersi: %100 açık, denetlenebilir, çatallanabilir, katılımcı bir topluluğa sahip ve tek bir sağlayıcıya bağımlı değil.

Şaşkınlık Kuyruklu Yıldızıyla Yüzleşmek

Perplexity, nihayetinde bir arama ve reklam şirketidir. Tarihiniz bir ürüne dönüşebilirBrowserOS'ta vaat açıktır: yerel veriler ve sizin tarafınızdan tam kontrol.

Güvenlik, gizlilik ve lisanslama

Felsefemiz "önce gizlilik"tir: Ollama/LM Studio ile kendi API anahtarlarınızı veya yerel modellerinizi kullanırsınızCihazınızda neyin kalıp neyin kalmayacağını siz seçersiniz ve geçmiş ve oturumları üçüncü tarafların erişiminden uzak tutarsınız.

Yasal ve toplumsal düzeyde, BrowserOS, AGPL-3.0 lisansı altında ücretsiz bir yazılımdırNasıl yapıldığını görebilir, sistem uyarılarını inceleyebilir, değişiklikler önerebilir, projeyi çatallandırabilir ve katkıda bulunabilirsiniz. Tüm bunlar, yaratıcılarının bahsettiği "San Francisco'dan sevgiyle yapıldı" ruhuyla.

Topluluk, rakamlar ve proje ivmesi

İlgi açıkça görülüyor. GitHub'da 4,3 binden fazla yıldıza, 25.000'den fazla indirmeye ve binin üzerinde kişiden oluşan bir Discord topluluğuna sahip. Aktif olarak katılan kişi sayısı. Başka bir parçada, "6,3 bin" ve "558" gibi metrikler (depoyla ilgili, muhtemelen yıldızlar/takipçiler/dallar) beliriyor ve bu da yükseliş eğilimini gösteriyor.

Teknik olarak proje, temel yapısıyla öne çıkıyor Chromium devinin üstünde C++, çok fazla sıkı çalışma ve yukarı akış değişiklikleriyle uyumluluğun sürdürülmesini ve aynı zamanda aracı katmanında yeniliklerin sürdürülmesini gerektiren zorlu bir yolculuktur.

Kullanım örnekleri ve demolar

Gerçek dünyadaki görevleri düşünün: LinkedIn uygulamalarınız arasında ilginizi çeken profilleri belirleyin ve bunları bir Google E-Tablosuna ekleyinUzun formları doldurun, birden fazla web sitesinden veri toplayın veya bir toplantı için önemli bilgiler içeren bir ön brifing hazırlayın. Bunu metin olarak açıklayın ve temsilci sizin gibi gezinip hareket etsin.

Konseptin eylem halinde gösterilmesini sağlayan görsel-işitsel materyal mevcuttur: “HackerNews.top.3.mp4”, “use-browserOS-to-chat.mp4” veya “use-browserOS-to-extract.mp4” gibi demolar Gerçek dünya ortamlarında destekli konuşmalardan veri çıkarmaya kadar her şeyi öğreterek otomasyonun gerçek bağlamınızda gerçekleştiğini pekiştiriyorlar.

Vizyon: Tarayıcının aracılar için bir "işletim sistemi" olarak kullanılması

Şirketler tarayıcıda yaşıyor: Salesforce, SAP, Workday, şirket içi araçlar… Bilgi işçilerinden oluşan bir ordu, günlerinin %60-80'ini web uygulamalarında geçiriyorBir aracı, bir insan gibi tıklayıp yazabiliyorsa, API'leri olmayanlar da dahil olmak üzere hemen hemen her arayüzü otomatikleştirebilir.

Projenin sunduğu vizyon şudur: BT, yeniden kullanılabilir "çalışan temsilcileri" dağıtabilirŞirketin "harcama aracısı", iş akışınıza uyarladığınız topluluk tarafından paylaşılan "Facebook reklam aracısı" vb. Daha az mekanik görev, değer katan şeylere daha fazla odaklanma.

BrowserOS'un arkasında kim var?

Projenin çekirdeğini, Big Tech'te ciddi bir geçmişe sahip iki ikiz kardeş oluşturuyor. Nikhil, C++ ve sistemleri kullanarak Reels'in ve Facebook akışının arka ucunda çalıştıNithin, YouTube'da ML mühendisi olarak çalıştı ve platformun ilk büyük öneri modeline (LRM) katıldı. düşük seviye ve AI katmanı onlara Chromium ile başa çıkma ve aynı zamanda onun üzerine "ajan beyni" inşa etme özgürlüğü veriyor.

  • C++ ve büyük ölçekli sistemlerde deneyim: Kritik ve yüksek performanslı servislerin bakımı.
  • ML ve öneri sistemlerinde uzmanlaşma: Modern modeller ve bunların uygulanması konusunda derin anlayış.

Topluluktan gelen sesler ve daha az bilinen alternatifler

İleri düzey kullanıcılar arasında potansiyeli olan "farklı" tarayıcılara karşı bir ilgi var. Wavebox, Ulaa, Arc, Ghost Browser veya Thorium gibi alternatifler test edildiZen Browser, üretkenliğiyle övülüyor (Chromium tabanlı olmasa da). Bu testler, Wavebox'ın oldukça kapsamlı ancak bunaltıcı olabileceğini ve tüm potansiyelini ortaya çıkarmanın zaman alıcı olduğunu; Ulaa'nın gizlilik konusunda övündüğünü ancak çok fazla ekstra özellik içerdiğini; Arc'ın karışık tepkiler aldığını ve Ghost Browser'ın henüz herkesi ikna edemediğini belirtiyor.

Toryum ile ilgili olarak, şunu duyuyoruz ki; Çok hızlı ama bazı güvenlik endişeleri var.İşte bu yüzden bazı insanlar bunu erteliyor. Ve çoğu zaman, en bilinenlere yönelmemeleri tavsiye ediliyor çünkü zaten yirmi kadarını denemişler ve amaç, gerçekten yeni bir şeyler sunan nadirlikleri keşfetmek.

Aracıların kullanımına ilişkin kısa kılavuz

İçeri girdiğinizde, gerçek görevleri tanımladığınız "sihirli an" gelir. "Şunu şunu ara" deyip özet döndürmek yerine, aracı etkileşimi tarayıcınızda gerçekleştirir.Web sitesinin bir API'si yoksa sorun değil: bir kullanıcı arayüzü var, bir aracının doğru bir şekilde kopyalayabileceği eylemler var.

  1. Hedefinizi tanımlayınÖrneğin, profesyonel bir ağdaki belirli kişileri bulmak ve onların bilgilerini bir elektronik tabloya aktarmak.
  2. Adımları onaylayın eğer acente bunları size önerirse (ne yapacağını denetlemek için faydalıdır).
  3. İlk seferde denetle İstemleri veya kuralları ayarlamak için tarifi tekrar kullanın.

MCP'nin kullanımı ve otomasyonu, API'leri ve modelleri "birleştirme" yeteneği buna olanak tanır tek bir aracı, uçtan uca tüm süreçleri çözer, daha önce birkaç aletin bantla birbirine bağlanmasını gerektiren bir şeydi.

Tasarım ve model kontrolüne dayalı gizlilik

Önemli bir avantaj ise yapay zeka motorunu seçme özgürlüğünün olmasıdır. OpenAI, Anthropic ile çalışabilir veya Ollama/LM Studio ile her şeyi yerel tutabilirsiniz.Rota, maliyet, gecikme süresi veya proje hassasiyetine göre ayarlanır. Mutlak gizliliğe öncelik verenler %100 yerel bir rotaya sahiptir.

Buna ek olarak, Proje, sistem komutlarının yayınlanmasına ve düzenlenmesine olanak tanırBu alışılmadık bir durumdur. Bu şeffaflık, aracının davranışını kuruluşunuza veya özel durumunuza göre ayarlamanızı ve kararları nasıl aldığını denetlemenizi kolaylaştırır.

BrowserOS projesine katkıda bulunma adımları

Eğer bu fikre inanıyorsanız ve destek olmak istiyorsanız, bunu desteklemenin birkaç yolu var. GitHub'da bir yıldız bırakın Görünürlüğünüzü artırmaya yardımcı olur; indirip kullandığınızda ilginç telemetri (eğer etkinleştirirseniz) ve geri bildirimler elde edersiniz; ve Discord'a katılmak yeni özellikler önermenize, keşfetmenize ve test etmenize olanak tanır.

Son olarak, resmi web sitesi genellikle bir hatırlatma görüntüler sisteminiz için tarayıcıyı indirinDilerseniz Chrome verilerinizi içe aktarabilir ve tercih ettiğiniz yapay zeka sağlayıcısına bağlanabilirsiniz. Geriye sadece aracılarınızı oluşturmak ve sizin için uygun olanı paylaşmak kalıyor.

Tüm resme bakıldığında, BrowserOS kendini bir Gizliliği ön planda tutan, Chromium tabanlı, büyüyen bir topluluğa sahip, ajan odaklı bir yaklaşımla açık kaynaklı tarayıcı.Uzantılarla uyumluluk, MCP, yerel modeller için destek (Ollama/LM Studio) ve AGPL-3.0 lisansı ve düzenlenebilir komut istemleri içeren açık bir taahhüt bir araya getiriyor. Chrome, Brave, Arc/Dia veya diğer reklam ve arama odaklı tekliflerin aksine, yapay zekanın "büyüsünü" her gün çalıştığınız siteye doğrudan getirmeyi hedefliyor. Hâlâ düzeltilmesi gereken ayrıntılar olsa da (yakında kullanıma sunulacak yapay zeka destekli bir reklam engelleyici veya Windows'ta ara sıra karşılaşılan kurulum sorunları gibi), hız ve kullanıcı etkileşimi, San Francisco'da sevgiyle geliştirilen ve web'i yalnızca bir tıklama zincirinden, nihayet sizinle birlikte çalışan temsilciler için bir platforma dönüştürme arzusuyla büyüyen bir projeye işaret ediyor.