Operating autonomously, OpenAI introduces revolutionary artificial intelligence model

Big news comes out of Silicon Valley, as OpenAI unveils its AI Agent that can autonomously perform complex, multi-step tasks by using its own virtual computer to browse the web, run code, use other terminals, manage files, and even interact with your personal apps and files (if you allow it).
For now, it's only available in the US for ChatGPT Pro users. " The operator will be in other countries soon," said OpenAI CEO Sam Altman. " Europe, unfortunately, will take a while," he added, without explaining why.
This marks an important moment towards AI that not only advises, but also does.
In a 25-minute video streamed live on YouTube, Sam Altman joined the Agent team of Casey Chu, Isa Fulford, Yash Kumar, and Zhiqing Sun to introduce and demonstrate the highly anticipated autonomous AI assistant.
“We have something interesting for you today,” Altman opened, before introducing the team and having Kumar and Sun dive into a demonstration of the Agent being prompted to plan all the details for attending a wedding, including choosing hotels, outfits, and a gift.
By now, most people are probably quite familiar with ChatGPT; part life coach, part search engine, and part editor. But at the end of the day, the user asks and the GPT answers, then the user asks a follow-up question. The agent is a transition from conversation to action.
It combines tools from OpenAI's Operator and Deep Research into a powerful system that seamlessly switches between different types of actions depending on the task at hand.
So, it can browse the Internet in real time to find up-to-date information, it can use a virtual command line, just like a human using a terminal, to execute code or scripts, and it can accurately read, analyze, and summarize large datasets and documents, then distill and present its work however you want.
“ By integrating these complementary strengths into ChatGPT and introducing additional tools, we have unlocked entirely new capabilities within a single model,” OpenAI wrote in a statement. “It can now actively engage with web pages – clicking, filtering, and collecting more accurate and efficient results. You can also naturally transition from a simple conversation to actionable insights directly within the same conversation.”
Ndërsa do t’i kërkonit GPT-së t’ju shkruante një itinerar udhëtimi për pushime, Agent mund të planifikojë gjithçka – të kontrollojë kalendarin tuaj, të kërkojë fluturime, ture dhe hotele, të rezervojë restorante, të hartojë email-e dhe të përgatisë të gjitha detajet e udhëtimit në PDF ose në formë dokumenti – vetë, me disa miratime nga ju gjatë rrugës.
Kjo kryesisht për shkak të përparimeve të Ndërfaqes së Programimit të Aplikacioneve (API), e cila i lejon asistentit tuaj të AI-së të “flasë” me sisteme të tjera softuerësh, për shembull – si Gmail API, Google Calendar API ose SharePoint API.
Është projektuar të veprojë më shumë si një asistent njerëzor, i cili mund të dërgohet për të trajtuar në mënyrë autonome detyra me shumë hapa, duke ditur se çfarë duhet të bëjë për të përfunduar secilën pjesë pa udhëzimin e përdoruesit. Pasi t’i jepni udhëzimet tuaja, ai do të konfigurojë një kompjuter virtual të sigurt të organizuar nga OpenAI ku në thelb do të menaxhojë projektet e punës.
“E gjithë kjo bëhet duke përdorur kompjuterin e vet virtual, i cili ruan kontekstin e nevojshëm për detyrën, edhe kur përdoren mjete të shumta – modeli mund të zgjedhë të hapë një faqe duke përdorur shfletuesin e tekstit ose shfletuesin vizual, të shkarkojë një skedar nga uebi, ta manipulojë atë duke ekzekutuar një komandë në terminal dhe pastaj ta shikojë rezultatin përsëri në shfletuesin vizual”, tha OpenAI. “Modeli e përshtat qasjen e tij për të kryer detyra me shpejtësi, saktësi dhe efikasitet.”
Siguria ishte një temë e madhe gjatë lançimit, dhe AI ka shumë funksione të integruara për të siguruar kontrollin e përdoruesit dhe për të parandaluar keqpërdorimin. Gjithmonë kërkon miratim të qartë para se të kryejë veprime si dërgimi i email-eve ose ndryshimi i skedarëve, dhe nuk mund të kryejë transaksione financiare. Kur vepron në faqet e internetit të ndjeshme, ajo hyn në “modalitetin e shikimit”, duke u ndalur nëse përdoruesi ndërron skedat.
Është gjithashtu e programuar për të identifikuar dhe injoruar kërkesat kundërshtare të fshehura në faqet e internetit për të manipuluar ose ngatërruar një AI. Dhe mjetet e privatësisë gjithashtu u lejojnë përdoruesve të pastrojnë historikun e shfletimit dhe të shkëputin lejet e aplikacionit.
Një gjë që përdoruesit mund ta gjejnë, megjithatë, është se Agjenti mund të jetë pak i ngadaltë. Po, është akoma më i shpejtë se një njeri, por planifikimi i pushimeve, nga fillimi në fund, mund të zgjasë disa minuta ose më shumë. Dhe do të ndalojë dhe do ta pyesë përdoruesin para se të dërgojë mesazhe, të bëjë rezervime ose të hyjë në skedarë, gjë që shton kohën. Në fund të fundit, qëllimi është që Agjenti të mos kërkojë leje ose kontrolle, por ende nuk jemi aty.
“If a task is taking longer than expected or feels blocked, you can pause it, ask it for a progress summary, or stop it entirely and get partial results,” OpenAI said. “If you have the ChatGPT app on your phone, it will send you a notification when you’re done with your task.”
Kumar said the team is more focused on "optimizing for difficult tasks" than on speed, and users can let Agent work in the background, rather than watching it run./ Reuters
Happening now...
America may withdraw from Europe, but not from SPAK
ideas
Who is the Surrel Rabbit?
The two wrong paths of the opposition with the Ombudsman
top
Alfa recipes
TRENDING 
services
- POLICE129
- STREET POLICE126
- AMBULANCE112
- FIREFIGHTER128
