Tuesday, March 5, 2024

Benchmarking LLMs in the Wild

 

Have you ever wanted to compare the results of different LLM models from the same prompt? Enter https://chat.lmsys.org/, a powerful tool for comparing the performance of different LLM models on the same task. With this tool, you can easily input multiple LLM models and their corresponding outputs, and then view a comparison of their results side-by-side. You can easily compare the performance of different LLM models on the same task, and gain valuable insights into their strengths and weaknesses. 

Here is the example that I used the same prompt from my previous post.


Explain me the following command.

podman run -d -p 3000:8080 --network slirp4netns:allow_host_loopback=true -v open-webui:/app/backend/data --name open-webui --restart always ghcr.io/open-webui/open-webui:main 



Happy modeling! 


Local LLM deployment framework - Ollama

Are you looking for an easy way to run LLM on your local environment? Ollama seems like a straightforward option. Open-WebUI (formerly known as Ollama-webui) even gives you a chatGPT-like web interface! To get Ollama up and running, you just need to follow a few simple steps.

Step 1: Install Ollama locally and deploy your preferred LLM. For example, you can run the command

 $ ollama run llama2 

to download the llama2 model. Ollama supports a variety of models available on ollama.com/library.

Step 2: Run Open-WebUI to get a web interface. To do this, run the command 

$ podman machine start, then 

$ podman run -d -p 3000:8080 --network slirp4netns:allow_host_loopback=true -v open-webui:/app/backend/data --name open-webui --restart always ghcr.io/open-webui/open-webui:main.

This will start the Open-WebUI container and map port 3000 on the host to port 8080 in the container, allowing incoming HTTP traffic on port 3000 to be forwarded to the container. Now, open your browser and navigate to http://localhost:3000 to access the web interface. 


To validate how my local LLM environment works, I used the above podman run command as an input to see, whether it can explain. So my simple prompt was;

Input: 

Explain me the following command.

podman run -d -p 3000:8080 --network slirp4netns:allow_host_loopback=true -v open-webui:/app/backend/data --name open-webui --restart always ghcr.io/open-webui/open-webui:main 


And here is the response! What would be your reaction on the response?

Response: 

The podman run command is a Docker-like command for running containers in the Podman environment. Here's a breakdown of the options used in the command you provided:
  • -d: Run the container in detached mode, meaning it will run in the background and not interact with the terminal. 
  • -p 3000:8080: Map port 3000 on the host to port 8080 in the container, allowing incoming HTTP traffic on port 3000 to be forwarded to the container.
  • --network slirp4netns:allow_host_loopback=true: Use the slirp4netns network plugin, which allows for host-to-container loopback connections. This is useful when developing applications that need to communicate with other containers or the host machine.
  • -v open-webui:/app/backend/data: Mount a volume from the open-webui directory inside the container to the /app/backend/data directory on the host. This allows data to be shared between the container and the host.
  • --name open-webui: Set the name of the container.
  • -restart always ghcr.io/open-webui/open-webui:main: Restart the container if it crashes or is terminated, using the ghcr.io/open-webui/open-webui:main image. The :main part of the image name indicates that this is the main image for the application. 
The ghcr.io domain is a container registry service provided by Google Cloud. It allows you to store and manage Docker images, including the open-webui image used in the command. 
In summary, the command runs a container using the slirp4netns network plugin, maps port 3000 on the host to port 8080 in the container, mounts a volume from the open-webui directory inside the container to the host's /app/backend/data directory, sets the name of the container, and restarts the container if it crashes or is terminated using the ghcr.io/open-webui/open-webui:main image.

Pretty cool, right?

  • Ollama - https://github.com/ollama/ollama
  • Open-WebUI (formally known as Ollama-webui) - https://github.com/open-webui/open-webui
Btw, I came across another local LLM studio for "discover, download, and run local LLMs" as well: https://lmstudio.ai/, fast moving space uh?


Some podman related commands that you may need to use for any needed debugging.
  • podman machine list
  • podman machine stop
  • podman machine start
  • podman container list
  • podman container rm open-webui
  • ollama serve
  • lsof -i:3000


Monday, August 29, 2022

My 2nd son has been starting this blog/forum: https://highschoolstudyhel.wixsite.com/amasite to help high school students. 

This website will help you revising/studying by answering your questions. Currently, this site can answer questions about IGCSE Mathematics, Co-ordinated science, Economics, Global Perspectives, DT (RM), AP US History, Chemistry, Biology, Macroeconomics. If you have any questions, just take a photo of your question, and post in on the forum page.


Good start!

Friday, February 15, 2019

테크트렌드인사이트 2018 - 정창우 전무, 클라우드 네이티브

2018 테크트렌드를 말한다...블록체인-AI발 생태계 격변

테크M, 테크트렌드인사이트2018 컨퍼런스 개최...분야별 전문가 전망 공유


 황치규 기자
 2017.11.30



      [테크M=황치규 기자] "2018년 기술로 인한 산업 생태계의 변화는 더욱 거세질 것이다. 다양한 분야에서 비즈니스의 본질이 바뀌고, 신기술을 활용한 서비스 모델들도 쏟아질 것이다."
      29일 머니투데이방송 테크M이 개최한 테크트렌드인사이트2018 컨퍼런스에선 블록체인, 인공지능, 커넥티드카, 보이스 플랫폼, 클라우드, 증강현실 기술이 국내외 ICT 시장에 미칠 영향에 대한 전문가들의 전망이 공유됐다. 
      특히 블록체인과 인공지능이 내년에 중량감 있는 기술 키워드가 될 것이라는 전망이 많아 주목된다.
      블록체인과 관련해서는 올해는 개념검증(PoC) 성격의 프로젝트가 많았지만 내년초를 기점으로 컨설팅과 구축 사업이 확산될 것으로 예상됐다.
      테크트렌드인사이트2018에서 블록체인노믹스를 주제로 발표한 SK주식회사 C&C의 오세현 전무는 "내년초부터는 블록체인 관련 컨설팅과 SI 프로젝트가 늘어나고 블록체인을 솔루션화하는 회사들도 나올 것이다"고 전망했다.
      오 전무에 따르면 블록체인은 광범위한 분야에 적용될 수 있는 잠재력을 갖췄다. 이미 금융은 물론이고 콘텐츠, 광고, 유통 분야도 파고들고 있다. 오세현 전무는 "블록체인이 만능 기술은 아니지만 중간자들이 있고 신뢰를 필요로하는 모든 분야에 영향을 미칠 수 있다"고 말했다. 블록체인을 통해 거래의 신뢰성과 투명성을 강화할 수 있다는 것이 오 전무 설명이다.
      블록체인 PoC를 해본 기업들이 실제 프로젝트로 시작하는데 있어 걸림돌은 기술이 아니다. 처음 해보는 것이라는 불안감이 더욱 큰 장벽이다. AI나 빅데이터와 달리 블록체인은 세계 각국이 비슷한 속도로 움직이다 보니 참고할만한 레퍼런스가 많지 않아, 국내 기업들이 부담을 가질 수 있다는 것이다. 그런만큼 기업들은 블록체인이 각자의 사업에 어떤 도움이 될지를 스스로 판단할 필요가 있다고 오 전무는 강조했다.
      AI의 경우 다양한 분야에서 업의 본질을 바꾸고 있고, 그 속도는 내년에 더욱 가속화될 것으로 예상됐다. AI 관련 발표를 진행한 인치원 카카오브레인 CSO는 "테슬라는 자신들의 강점을 자율주행 알고리즘이라고 말하고, GE는 공장에서 발생하는 데이터를 수익을 내는 회사라 하고 있다"면서 "AI로 인해 업의 생명 주기가 짧아지고 있다. 조만간 많은 분야에서 AI로 인해 업의 본질이 변화할 것이다"고 말했다.
      인치원 CSO에 따르면 AI 알고리즘은 최근들어 진화에 진화를 거듭하고 있다. 미국에 이어 중국도 AI 강국 반열에 올라섰다. 특히 중국은 거대한 데이터와 국가 차원을 등에 업고 미국을 위협하는 AI 역량 확보에 속도를 내고 있다.
      규모로 미국이나 중국계 업체와 겨룰 수 없는 국내 기업이 AI로 경쟁력을 갖기 위해서는 어떻게 해야할까?
      인치원 CSO는 제휴를 통해 규모를 키워야 한다고 강조했다. 카카오가 개발한 AI 엔진을 삼성전자 스마트폰, LG전자 가전, 현대자동차, SK하이닉스 반도체 등 글로벌 시장에서 입지가 강한 하드웨어 탑재하는 것이 중요하다는게 그의 설명이다.
      인치원 CSO는 "글로벌 AI 시장은 이미 규모의 경쟁에 돌입했다"면서 "카카오브레인은 제휴를 확대할 수 있는 오픈플랫폼을 제공하고 있다"고 말했다.
      커넥티드카 서비스는 ETRI의 최정단 자율주행시스템연구그룹장이 발표를 맡았다. 그에 따르면 커넥티드카 서비스는 현재 기능안전, 보안과 효율적인 이동 서비스를 제공하는데 초점이 맞춰져 있다. 이를 기반으로 자율주행을 향해 진화하고 있다. 
      최 단장에 따르면 지율주행을 위해서는 다양한 네트워크 기술 발전으로 데이터와 클라우드에의 접근 확대, 연결성과 시스템 보안, 사용자 인증, 사용자 인터페이스와 응용 프로그램, 센서 고집적 솔루션, 멀티코어, 저전력, 저발열 시스템 등의 기술이 갖춰져야 한다. 또 범부처 협력 및 민간의 개방 정책이 필요하다고 최 단장은 강조했다.
      보이스 플랫폼도 2018년 보다 존재감을 키울 것으로 전망된다. 황성재 퓨처플레이 파트너는 "아마존 알렉사를 탑재한 하드웨어 채널이 하나 늘어나면 아마존 소비자 구매가 10% 늘어나고 있다"면서 "내년에는 아마존 에코처럼 음성 인식 SW를 탑재한 하드웨어들이 더욱 늘어날 것이다"고 말했다.
      클라우드의 경우 클라우드 인프라 장점에 맞춰 애플리케이션을 개발하는 트렌드가 강조됐다. 마이크로서비스도 키워드로 꼽혔다. 발표를 맡은 IBM 아태지역 클라우드 담당 정창우 전무는 "마이크로서비스는 조각조각 나눠서 애플리케이션을 개발하는 방식"이라며 "기존에 한번에 개발하는 것과 비교해 특정 서비스만 확장하거나 수정을 적용하는데 용이하다"고 말했다.
      증강현실와 관련해서는 공유 플랫폼이 강조됐다. 발표를 맡은  우운택 KAIST 교수는 "내년에는 저작된 가상 및 증강현실 콘텐츠를 공유하는 플랫폼에 대한 관심이 커질 것이다"면서 공유 플랫폼으로서 3차원 지도에 대한 중요성이 커질 것으로 내다봤다.
      [테크M=황치규 기자(delight@techm.kr)]

      Sunday, October 1, 2017

      AI컨퍼런스_정창우 상무 인터뷰

      시사저널e는 오는 25일 서울 삼성동 코엑스에서 열리는 ‘AI, 현재가 된 미래의 삶, 인공지능이 바꾼 일상 & 비즈니스라는 주제로 제3회 인공지능 컨퍼런스 를 개최한다. 이 자리에 연사로 나설 정창우 한국IBM 연구소장(상무)을 만나 인공지능의 현재와 미래를 들어봤다
      #ibmaot

       

      Monday, September 25, 2017

      정창우 한국IBM 상무 “인공지능과 공존의 길 찾아야”

      병 치료, 대학 조교, 챗봇 등 다양한 AI-인간 협업사례 소개

      #ibmaot
      정창우 한국IBM 상무가 시사저널e, 시사저널, 국회 4차산업혁명포럼이 25일 코엑스에서 개최한 'AI, 현재가 된 미래의 삶' 행사에서 '인공지능 활용사례'를 주제로 발표하고 있다. / 사진 = 최형균 기자


      인공지능(AI) 기술이 의사의 진단 후 차도가 없던 환자의 병명을 재진단해 병을 치료하고, 미국은 대학 조교 평가에서 인공지능 조교가 가장 높은 평가를 받았다인공지능이 사람보다 나은 효율을 나타내는 사례는 이외에도 여러 산업에서 다양하게 있다.

      그러나 인공지능이 책임까지 지진 않는다책임은 사람의 몫이다인공지능과 사람의 공존을 모색해야 하는 이유다

      정창우 한국IBM 상무는 25일 시사저널e, 시사저널국회 4차산업혁명포럼이 공동 주최한 ‘AI, 현재가 된 미래의 삶’ 세미나에서 이같은 사례를 소개하며 인공지능이 사람보다 낫다는 얘기를 하려는 것이 아니다며 사람은 경험을 기반으로 판단을 내려 선입견이 생길 수도 있는데, 인공지능의 판단을 보고 한 번 더 생각할 수 있는 계기를 만들 수 있다고 말했다

      가령 일본 한 병원에서 급성골수암으로 진단받은 한 환자는 인공지능 컴퓨터가 2차 백혈병으로 진단한 후 치료방법을 바꿨다진단명과 치료법이 바뀌자 환자는 급속히 호전돼 퇴원할 수 있었다인공지능 컴퓨터는 2500만여건의 의학논문과 1500만건 이상의 의약품을 학습하면서 진단도 10분 만에 해냈다.

      미국 애틀랜타에 있는 조지아텍에서도 인공지능 조교가 학생들로부터 가장 뛰어나다는 평가를 받았다이 인공지능 조교는 자신이 아는 질문에 대해서는 누구보다 빨리 답을 해줬고, 잘 모르는 질문은 인간의 도움을 받았다인공지능이 인간보다 잘할 수 있는 영역이 있기 때문에 사람과 협업을 하면 더 좋은 결과물을 낼 수 있는 있다는 것이다

      정 상무는 인공지능(AI)의 A는 인공(Artificial)’이라기보다는 증강(Augmented)’이 더 적합하다며 사람의 능력을 배가할 수 있는 기술이라고 강조했다

      현대카드가 최근 선보인 챗봇도 인간의 도움을 주는 형태로 서비스가 이뤄지고 있다특히 기업은 고객 접점에 인공지능을 적용해 서비스도 개선하고 있다

      카드사 혜택은 상품별로 달라 카드사 직원이 다 알기 어려울 정도로 ​복잡하다카드사 챗봇이 이를 빠르게 찾아 제공하고 있다

      정 상무는 대리주차를 무료로 지원하는 카드가 있는지를 물어보면 챗봇이 혜택을 찾아 대답해준다며 고객 접점에서도 변화가 여러 기업들에서 공통적으로 일어나고 있다고 말했다.

      AI 인재양성, 지식습득보다 학습능력 중요해질 것

      [AI컨퍼런스2017] “AI 인재양성, 지식습득보다 학습능력 중요해질 것”

      “기업 프로젝트, 잘 아는 부분부터 작게 시작해야”

      25일 시사저널e, 시사저널, 국회 4차산업혁명포럼이 공동 주최해 서울 삼성동 코엑스에서 열린 ‘AI, 현재가 된 미래의 삶’ 컨퍼런스 패널토의. 왼쪽부터 김영덕 롯데엑셀러레이터 상무, 정창우 한국IBM 상무, 최윤석 한국마이크로소프트 전무. / 사진 = 최형균 기자
      한 분야를 단순하게 알아야만 하는 시대는 갔습니다각 기술들이 빠르게 융합되고 있습니다앞으로는 학습능력이 중요해 질 겁니다.”

      25일 시사저널e, 시사저널국회 4차산업혁명포럼 공동 주최로 서울 삼성동 코엑스에서 열린 ‘AI, 현재가 된 미래의 삶’ 컨퍼런스 패널토의에서 최윤석 한국마이크로소프트 전무는 인공지능 시대 교육에 대해 이같이 말했다

      인공지능이 대량의 데이터를 빠르게 학습해 비교적 정확하게 판단할 수 있는 시대를 맞아, 인간을 교육하는 체계는 미래 인재 양성을 위해 어떤 변화를 가져가야 할 지에 대해 전문가가 내놓은 대답이다

      최 전무는 한 분야에 대한 깊이 있는 지식과, 전문분야와 결합할 수 있는 다양한 지식에 대한 관심과 습득능력이 중요해지고 있다고 강조했다

      그는 과거에는 기술 중 특정 영역 하나를 잘하면 인정받았지만 가치가 달라졌다고 말했다이어 단편적인 기술 하나만 적용한 결과와 신기술 4~5개가 융합한 결과는 그 차이가 크다며 어떤 산업과 기술을 엮었을 때 시너지가 있는가를 볼 수 있어야 하기 때문에 연관성에 대한 이해가 필요한 시대라고 덧붙였다.

      김영덕 롯데엑셀러레이터 상무와 정창우 한국IBM 상무도 패널토의에 각각 좌장과 토론자로 참석, 인공지능 시대에는 과거와 교육의 형태가 달라져야 한다고 입을 모았다

      김 상무는 현재 교육시스템을 보면 다시 생각해봐야 하는 것이 아닌가라는 생각이 든다며 근본적으로 교육시스템에 대해서도 생각을 다시 해봐야 할 것이라고 강조했다인공지능 시대에 단순 주입식 교육이 변화에 적응할 수 있는 인재를 양성하기 어려울 것이라는 의미다

      정 상무도 다른 토론자들의 의견에 공감했다그는 기술이 상당히 빠른 속도로 변화하면서 학습능력이 중요해졌다며 신기술은 과거의 기술을 기반으로 발전하기 때문에 잠깐이라도 게을러지는 순간 이해하는데 들어가는 노력이 굉장히 커진다고 설명했다이어 인공지능과 로봇이 결합한 경우 등 여러 서비스에 관심을 갖고 시도해보는 것도 준비가 될 것이라고 덧붙였다.

      이날 패널토의 토론자들은 이제 막 시작된 인공지능 시대를 준비하는 기업들의 초기 접근방법에 대해서도 조언했다기업들은 인공지능을 적용하려고 해도 내부 데이터 준비가 부족하다며 어려움을 토로하고 있다

      정 상무는 적용할 수 있는 부분부터 작게 시작하라며 데이터는 큐레이터 역량에 의해 새롭게 보여질 수 있으니 잘 알고 있는 부분부터 반드시 살펴보라고 귀띔했다

      최 전무도 이미 기업들은 데이터를 많이 축적하고 있다며 엄청난 프로젝트를 시작하려 하기 보다 주변에서 정보를 찾아라고 조언했다. 

      <저작권자 © 시사저널e 무단 전재 및 재배포 금지>