:-D thanks<br><br>mark<br><br><div class="gmail_quote">On Thu, May 15, 2008 at 3:25 PM, Jimmy Wales &lt;<a href="mailto:jwales@wikia.com">jwales@wikia.com</a>&gt; wrote:<br><blockquote class="gmail_quote" style="border-left: 1px solid rgb(204, 204, 204); margin: 0pt 0pt 0pt 0.8ex; padding-left: 1ex;">
<div class="Ih2E3d">Paul Vixie wrote:<br>
&gt; 1. why is ISC&#39;s the only backend? &nbsp;jer&#39;s vision is backend syndication, so,<br>
&gt; if his XML schema is stable and if there&#39;s at least one f/l/oss implementation<br>
&gt; of crawling and of indexing, then, why aren&#39;t there more crawlers and more<br>
&gt; indexers, conforming to jer&#39;s XML, possibly flooding data between each other<br>
&gt; and possibly dividing up the workload so that all crawlers don&#39;t have to<br>
&gt; crawl all sites? &nbsp;ISC ought to have peers, and we ought to be able to have<br>
&gt; gentlemen&#39;s agreements, like, &quot;we&#39;ll do [a-l].com, you do [m-z].com&quot;, etc.<br>
<br>
</div>We strongly support this notion of backend syndication, and we are<br>
hopeful that as the infrastructure and protocols mature, we will get<br>
more and more people working with us on this.<br>
<div class="Ih2E3d"><br>
&gt; 2. why is Wikia&#39;s the only frontend? &nbsp;again referring to the syndication<br>
&gt; model, and knowing that there are other &quot;social search engines&quot;, when will<br>
&gt; we see someone other than wikia use ISC&#39;s backend, or any other backend whose<br>
&gt; data can be reached using jer&#39;s XML?<br>
<br>
</div>Hopefully people can start on this soon... as has already been pointed<br>
out, a great start might be to use our code... sounds like Jer is<br>
deciding on the license now.<br>
<div class="Ih2E3d"><br>
&gt; 3. who is driving the syndication model? &nbsp;it&#39;s clear that ISC knows how to<br>
&gt; provide network and power, and that jer knows how to design the system and<br>
&gt; build various parts of it, but who is the champion for jer&#39;s vision -- who<br>
&gt; will drive us to better answers for #1 and #2 above? &nbsp;who ought to be in here<br>
&gt; answering critics and beating the drum, which is a distraction to jer (and<br>
&gt; candidly he&#39;s too busy to do this part well unless he drops other stuff<br>
&gt; that&#39;s already late)? &nbsp;remembering that jimbo keeps this issue alive in the<br>
&gt; press, the overall project still lacks a day to day &quot;programme manager&quot;.<br>
<br>
</div>We just transitioned our New York office to fulltime work on the search<br>
project, and Dan Lewis is being put fulltime on the task of community<br>
outreach: answering critics, beating the drum, and doing the detailed<br>
work of working with inbound inquiries from potential partners who are<br>
already interested, outreach to potential partners who are not yet<br>
interested, etc.<br>
<div class="Ih2E3d"><br>
&gt; 4. what else is jer working on? &nbsp;has wikia dedicated him to this project or<br>
&gt; does he also handle day to day fire fighting on wikia&#39;s existing services to<br>
&gt; justify his paycheck? &nbsp;and while we&#39;re on that topic, what other personnel<br>
&gt; has wikia dedicated to this -- how seriously are they really taking it, in<br>
&gt; terms of cash on the barrel head?<br>
<br>
</div>Jer is fulltime on search, as are several others. &nbsp;Dennis, Seth,<br>
Jeffrey, David, Aaron, Dan... I feel that I am forgetting someone.<br>
<br>
We are prepared to ramp up our commitment as we start to get traction,<br>
as well. &nbsp;At the present time, every time I ask the team what we need to<br>
buy, they say &quot;not yet, we are coding&quot;. :)<br>
<div class="Ih2E3d"><br>
&gt; 5. who else is working on this, outside of wikia? &nbsp;what outside volunteers<br>
&gt; or wikia competitor&#39;s employees have commit access to the source pool for<br>
&gt; the crawler, or indexer, or front end, or have root access to the donated<br>
&gt; back end machines hosted by ISC? &nbsp;if the answer is nobody, then is that due<br>
&gt; to lack of outreach (see #3 above) or is it wikia&#39;s preference that outsiders<br>
&gt; contribute content rather than code and sysops? &nbsp;(is that written anywhere?)<br>
<br>
</div>Strong preference that we get lots of people coding on a fully open<br>
system, as they like it. &nbsp;I think so far we have not done a great job of<br>
outreach, but then again, we have not had everything in place to get<br>
people oriented and started.<br>
<br>
Also, we view ourselves as a &quot;good neighbor&quot; part of the existing Nutch<br>
project: Dennis is a Nutch committer who is starting to work on a set of<br>
ideas he is calling &quot;Nutch 2.0&quot;.<br>
<div class="Ih2E3d"><br>
&gt; 6. where are the mini-articles stored? &nbsp;if outside volunteers are mostly<br>
&gt; contributing data, is that data stored on wikia&#39;s front end? &nbsp;if so, what are<br>
&gt; the redistribution terms -- would wikia flood this data to competing front<br>
&gt; end operators, and accept incoming floods of similar data from competitors?<br>
&gt; or, is this the &quot;secret sauce&quot;, there&#39;s no way to get access to contributed<br>
&gt; data of this kind except one article at a time, inside wikia&#39;s advertising<br>
&gt; system?<br>
<br>
</div>It&#39;s all GFDL, and we make available database dumps. &nbsp;We would have to<br>
consider a &quot;flood&quot; of incoming data from a community/editorial point of<br>
view, but totally welcome it, and are totally committed to sharing<br>
everything extremely liberally.<br>
<div class="Ih2E3d"><br>
&gt; 7. given that the idea of &quot;taking on google&quot; is silly, given their size and<br>
&gt; focus and ambition and brand strength and so on, and that what we can<br>
&gt; actually hope to achieve with this project is to change the game and make<br>
&gt; search part of the internet infrastructure, where are the white papers,<br>
&gt; journal articles, and outreach glossies explaining what the new world of<br>
&gt; internet search could look like, and what effect this change will have on<br>
&gt; google, microsoft, yahoo, and the current market hierarchy, and the rest of<br>
&gt; the &quot;social search&quot; scene?<br>
<br>
</div>I think this is a really great question. :)<br>
<br>
One of the things I have been arguing is that we are no threat to google<br>
even if we are wildly successful at &quot;making search part of the internet<br>
infrastructure&quot; as you put it...<br>
<br>
Google&#39;s brand is tied up with search, but Google&#39;s business is not<br>
searhc, per se, but the matching of advertisements to user actions and<br>
intentions online. &nbsp;The threat to google is not an open source<br>
alternative that helps 1,000 small competitors to flourish, but a single<br>
large proprietary competitor (Powerset?) that captures enough market<br>
share to take away the advertising marketplace.<br>
<br>
1,000 small competitors are much more likely to simply partner with<br>
Google for ad revenues, because buyers go where the sellers are, and<br>
sellers go where the buyers are.<br>
<div class="Ih2E3d"><br>
&gt; 8. has anybody reached out to yahoo and microsoft to see if they&#39;d like to<br>
&gt; join this effort or at least sponsor it, since as #2 and #3 in internet<br>
&gt; search today, they&#39;re the ones with the most to gain if we change the game.<br>
&gt; and if nobody&#39;s doing this now, and i did it, what would wikia say about<br>
&gt; sharing the sponsorship burden with other players, perhaps larger players?<br>
<br>
</div>We have done some of this, and would be eager to support you if you want<br>
to help us with it. &nbsp;We can talk privately about the status of current<br>
talks but there is nothing to report and nothing likely to happen right<br>
away... but there are a lot of interested parties in the industry.<br>
<div class="Ih2E3d"><br>
&gt; this list of questions isn&#39;t meant to be exhaustive. &nbsp;but as in my own<br>
&gt; controversial efforts over the years, i find the quality of criticism here<br>
&gt; somewhat low.<br>
<br>
</div>:-) &nbsp;Quality criticism is extremely valuable.<br>
<div class="Ih2E3d"><br>
&gt; also for the record, ISC&#39;s hosting of this project has been a cash neutral<br>
&gt; event for us, which is important since we don&#39;t have cash for this kind of<br>
&gt; thing. &nbsp;the 15-ton air handler wikia bought feeds a room that has other<br>
&gt; projects in it too, and our network is a fixed cost, and wikia has agreed<br>
&gt; to pay for the power we use for search, and the servers were all donated,<br>
&gt; and that donation was targetted for this project, and we got a lot more<br>
&gt; servers than we needed, and we&#39;ve been passing the excess along to other<br>
&gt; f/l/oss and internet security projects. &nbsp;so no matter whether this project<br>
&gt; changes the world, ISC is already winning.<br>
<br>
</div>:-)<br>
<br>
--Jimbo<br>
<div><div></div><div class="Wj3C7c">_______________________________________________<br>
Wikia Search mailing list<br>
<a href="http://alpha.search.wikia.com/" target="_blank">http://alpha.search.wikia.com/</a><br>
Change options or unsubscribe: <a href="http://lists.wikia.com/mailman/options/search-l" target="_blank">http://lists.wikia.com/mailman/options/search-l</a><br>
</div></div></blockquote></div><br>